8月28日,2025中国国际大数据产业博览会在贵阳市开幕。本届数博会以“数聚产业动能 智启发展新篇”为主题,洞察数据产业的发展新趋势,探寻数据价值释放的多元路径。展现数据要素与人工智能技术融合创新的最新成果,推动数据资源的高效汇聚与价值释放,为产业升级和经济高质量发展注入强劲动力。

一、我国数据产业的规模和格局
大数据作为新兴产业,目前在中国发展动能强劲,产业规模已超过5.8万亿元,未来5年,有望继续保持15%以上的年均增长率,到2030年产业规模预计超过13万亿元。
目前中国数字基础设施在规模、技术等方面已处于世界领先地位,算力总规模位于全球第二。预测到2025年年底,数字经济增加值有望达到49万亿元,占GDP的比重将达到35%左右。
数据产业是利用现代信息技术对数据资源进行产品或服务开发,并推动其流通应用所形成的新兴产业。中国数据企业数量超过40万家,仅长三角地区就聚集数据企业超10万家。
国家数据发展研究院副院长姜江介绍,初步估算,数据产业从业人员已经超过500万人,数据标注员、数据经纪人、数据科学家、数据分析师、算法工程师等,这些都是伴随数据产业这一新兴行业出现的一系列新的岗位。

数据产业分布上又呈现什么样的特点呢?最新测算显示,东部地区产业规模占大头,占全国比重近七成。东部、中部(含东北)和西部地区的数据产业规模分别为40819亿元、10075.6亿元和7699亿元,占全国比重分别为69.7%、17.2%和13.1%。其中,长三角地区产业聚集效应突出,聚集数据企业超过10万家,产业规模占全国的22.6%。
当前,我国数据产业重点企业区域分布呈现出东部地区引领,中西部地区比翼的发展格局。

二、网信办和国家数据局对数字经济产业未来展望
中央网信办主任庄荣文在致辞中说,要坚持赋能发展,推动数字技术、网络技术、智能技术与实体经济深度融合,深入实施“人工智能+”行动,加速数字化绿色化协同转型发展,培育产业转型升级新动能。坚持普惠发展,强化数字技术赋能政务服务,实施数字乡村强农惠农富农专项行动,提升全民数字素养,满足人民美好生活新期待。坚持安全发展,提升网络安全和数据安全水平,促进数据跨境高效便利安全流动,强化人工智能安全治理,筑牢网络空间安全新屏障。坚持开放发展,积极开展人工智能、电子政务、数字经济等国际合作,持续优化数字营商环境,构建国际互利合作新格局。
国家数据局局长刘烈宏在致辞中说,要着力完善数据基础制度,优化发展环境;建设数据基础设施,打造数据安全高效流通利用基础;加强场景应用,引领数据价值释放;构建全国一体化数据市场,发挥市场配置资源功能;壮大数据产业,培育良好产业生态。

三、建设一个互联、互通、互操作的全球数据基础设施
下一代互联网国家工程中心主任刘东在演讲中表示,构建一个能够承载未来数十年,甚至更长时间的数据基础设施,不仅关乎数字经济的发展,更关乎人类未来AI时代的可持续发展。我们要建设的不仅是一个“能跑”的系统,更是一个可持续、可协作、可治理的新型数据基础设施,一个互联、互通、互操作的全球数据基础设施,一个未来世界的底座。

1.数据流通“四大困境”:不愿共享、不会共享、不敢共享、不能共享
数据正在取代能源,成为新一轮国际竞争的关键底座。过去,数据常被视为“副产品”,而如今,它已成为数字经济和人工智能创新的“第一要素”。然而,现实并不乐观,企业与机构在数据流通中普遍存在“四大困境”:不愿共享(价值化和利益分配问题)、不会共享(缺乏接入和互操作性能力)、不敢共享(规则与法律顾虑)、不能共享(所属权与安全限制)。如果没有数据基础设施理念和路径,这些障碍将不断加剧,导致“建得越多、孤岛越多”,反而削弱数据的潜在价值,数据基础设施的建设就是为了解决这些难题。

2.建设数据基础设施“三要素”:开放、互联互通、互操作
在演讲中,刘东提出了建设数据基础设施的“三要素”——开放、互联互通、互操作,并系统阐释了其内涵与实践路径。
开放意味着生态包容与规则透明。数据的价值来源于共享,只有在共识的管理规则、数据标准、接口协议和安全机制之上,才能让更多主体进入同一生态,形成网络效应、规模效应,孕育出新的产业机会。
互联互通意味着全球范围的可通达。未来数据基础设施必然像互联网一样,为数据跨域跨境流动提供低成本、高安全的灵活传输能力。只有真正打通网络链路,数据要素才能跨越国界和行业壁垒,形成全球性的流通效应。
互操作则是检验数据基础设施成败的关键。不同主体不仅要“能连上”,更要“能协同”。这不仅需要接口协议、数据格式和语义理解的标准化,更需要安全机制和信任机制的统一。

四、要率先建立制度化的数据购买和使用机制
北京交通大学教授张向宏说,今年全行业最高频的热词有两个,第一个人工智能,第二个就是高质量数据集。高质量数据集构建已经引起了全社会的广泛关注和共识。随着人工智能正加速落地到千行百业,高质量数据集成为影响人工智能快速发展的重要燃料。
张向宏呼吁,政府应率先建立制度化的数据购买和使用机制,推动数据价值被社会广泛认可。
近年来国家在推动数据要素化、价值化方面虽已取得显著成就,但挑战仍然突出。首先,从产业主体规模来看,尽管我国目前已有超过40万家数据企业,但与400多万家数字经济核心企业和上千万家数字产业企业相比,整体规模仍偏小,产业基础相对薄弱。

数据的质量决定了智能体和垂直大模型的价值。例如,工业和商业领域需要大量力觉、视觉、听觉等数据来训练智能机器人,而医疗、政务、自驾等行业则依赖于各自深藏于私域的行业数据。因此,无论是智能体还是垂直大模型,构建高质量数据集是关键问题。
在政策和产业推动下,许多地方建立了数据采集标注基地和高端数据中心,市场需求十分旺盛。然而,目前我国高质量数据集的构建仍存在明显问题。
首先,行业整体仍处于“作坊化生产”阶段,自动化和智能化程度较低。其次,数据建设企业规模偏小,水平不高。

更重要的是,社会整体缺乏“花钱买数据”的意识。无论政府、企业还是个人,普遍习惯于花钱买算力、买模型,却没有花钱购买数据的习惯。这导致政府无法直接公开涉密的原始数据层面,但又缺乏预算支持高质量数据集的加工和供给。企业之间也普遍存在“要上游数据免费给我,但不给下游数据”的单向共享现象。为解决这些问题,张向宏呼吁推动政府率先垂范,建立付费购买和使用数据的习惯,形成数据价值认可的氛围。