乘“数”而上 向“新”而行
国务院新闻办近日举行“高质量完成‘十四五’规划”系列发布会,聚焦数字中国建设显著成就。2023年,中共中央、国务院印发了《数字中国建设整体布局规划》,标志着数字中国建设进入了整体推进的新阶段。这场发布会系统总结了数字化浪潮如何深刻重塑生产生活,交出了一份沉甸甸的时代答卷。
数字中国建设成就显著
“‘十四五’时期,我国牢牢把握数字化、网络化、智能化发展机遇,全面深化数据要素市场化配置改革,加快数字化绿色化协同转型发展,推动数字中国建设取得显著成就。”国家发展改革委党组成员、国家数据局局长刘烈宏从5个方面进行了介绍。
一是数字基础设施实现长足发展。截至2025年6月底,我国5G基站总数与2020年相比增长了5倍,达到455万个;千兆宽带用户增长了34倍,达2.26亿户;算力总规模位于全球第二,有力带动了经济社会发展。产业带动方面,数字基础设施投资形成庞大市场需求,带动集成电路、通信网络设备、计算机、服务器和终端产品等信息通信技术产业链上下游发展。激发消费方面,数字基础设施的超前部署和迭代升级,带动网络购物、在线教育、远程医疗和5G+工业互联网等新模式新业态蓬勃发展。农业农村方面,随着5G网络和农村电商的发展,手机成了“新农具”,数据成了“新农资”,直播成了“新农活”,有效带动农村居民增收致富。区域发展方面,“东数西算”工程深入实施,促进算力这一新质生产力的科学布局,八大算力枢纽节点中有5个在西部,有利于发挥西部地区清洁能源优势,促进区域协调发展。
二是数字技术创新实现新突破。过去,业界常说“缺芯少魂”,形象反映了我国在高端芯片、操作系统等方面自主可控不足的问题。经过多年持续攻坚,我国在数字领域突破了一批关键核心技术,逐步解决了上述问题。集成电路加快布局,形成覆盖设计、制造、封装测试、材料和装备的完整产业链。国产操作系统加速崛起,以鸿蒙系统为例,鸿蒙生态设备总量突破11.9亿台,为手机、汽车及家电等1200多类产品装上了“智能中枢”。我国人工智能综合实力也实现整体性、系统性跃升,人工智能专利数量占全球总量的60%,人形机器人、智能终端等领域不断突破。
三是数据要素价值加快释放。我国体系化推进数据要素市场化配置改革,打出政策“组合拳”,推动海量数据优势不断转化为国家竞争新优势。完善数据基础制度方面,2024年推出公共数据资源开发利用等21项政策,今年还将推出数据产权等10多项制度。布局数据基础设施方面,支持各地开展流通利用基础设施先行先试,不断夯实数据开发利用的设施底座。推动数据开发利用方面,以场景牵引带动数据要素价值充分释放,深入实施“数据要素×”行动,开展公共数据“跑起来”示范场景建设。培育数据市场方面,一批围绕数据汇聚共享、开发利用的数据企业正在孕育兴起,数据交易日趋活跃,全国一体化数据市场正在加快构建。
四是数字经济发展动能更加强劲。数字产业化方面,截至2024年底,我国软件收入规模较2020年增长80%,规模以上电子信息制造业增加值增长超70%。产业数字化方面,智能化转变、数字化改造加速推进,建成了万余家智能工厂,覆盖超过80%的制造业行业大类,智能家居、智能穿戴等成为消费新潮流。数据要素正加速赋能千行百业发展,农业领域,利用数据赋能智慧施肥,综合提升产量5.5%;工业领域,依托海量测井数据开发出行业大模型,钻井决策效率提升了15倍;服务业领域,利用公路货运行业数据实现司机与货主分钟级车货匹配,提升单车运行效率30%以上。数字经济的蓬勃发展带动新增职业超100个,创造了新的就业机会。
五是数字公共服务更加可感可及。“高效办成一件事”已进入制度化、常态化推进的新阶段,越来越多的事项实现“数据多跑路、群众少跑腿”。教育、医疗、社保和养老等公共服务数字化水平不断提升,有效破解“最后一公里”难题。
刘烈宏总结:“‘十四五’时期数字中国建设有力支撑了我国经济社会高质量发展,展望‘十五五’,我们有信心、有能力在数字中国建设的征程上取得更大成就,推动数据要素赋能经济社会发展,让全体人民更好共享数字化发展红利。”
数据产业发展前景广阔
数据产业主要包括数据采集汇聚、计算存储、流通交易、开发利用、安全治理和数据基础设施建设及服务等业态,是促进数据要素市场化价值化的新兴产业。近年来,我国数据产业发展乘势而上、逐步壮大。
国家发展改革委党组成员、国家数据局局长刘烈宏介绍,我国数据产业正处于快速发展阶段,市场空间大,已成为数字经济发展的新增长点。据国家数据发展研究院研究,2024年全国数据企业数量超过40万家,数据产业规模达5.86万亿元,较“十三五”末增长了117%,预计未来几年仍将保持较高的增长水平。
刘烈宏还提到,当前,数据技术正从商业智能(BI)向人工智能(AI)加速演进,以数据深度挖掘和融合应用、算法算力和数据高度集成为主要特征的产业生态正在形成。数据驱动技术创新、应用创新、产业创新不断深化,数据“采存算管用”全链条焕新迭代,催生出“数据即服务”“知识即服务”“模型即服务”等新模式、新业态。来自国家数据发展研究院的数据显示,2024年,上市数据企业平均研发投入较“十三五”末增长79%,年均增速是15.7%,产业链创新活力持续增强。
在此背景下,数据产业呈现集群发展态势。从区域来看,长三角形成了多层次、全链条的数据产业生态,资源共享、创新联动的集聚效应尤为突出,2024年长三角数据产业规模占全国的22.6%,集聚数据企业超过10万家。从城市来看,北京、上海、广州、深圳和杭州等城市,资源要素富集、技术创新活跃、应用场景丰富,吸引大量头部企业和创新主体,产业生态化集聚趋势较为明显。
“今年,我们计划部署一批数据产业集聚区建设试点,以此为抓手不断优化产业布局,加快形成产业生态和规模优势。”刘烈宏说,总体来看,我国数据产业发展势头良好、前景广阔,下一步将持续优化产业发展环境,培育多元经营主体,为发展新质生产力、塑造新动能新优势提供更加有力的支撑。
数据基础设施建设尚在起步阶段
数据流通应用需要在安全可信的环境下进行,从而实现可管可控可计量。同时,数据基础制度的承载落地和数据资源的供需对接,都需要一套强大的物理设施支撑和保障。
“党的二十届三中全会提出,建设和运营国家数据基础设施,正是顺应数据科技持续迭代、人工智能高速发展所作出的科学决策。”国家数据局副局长夏冰表示,作为“十四五”期间提出的全新概念,建设和运营国家基础设施,强调以释放数据价值为目的,强调以建设运营数据流通应用平台为重点,同时充分融合网络、技术,以及各种标准和规范。
夏冰说,数据基础设施建设工作自去年启动,突出两个关键:一个是抓规范、促共识,实现数据领域的“车同轨、书同文”;另一个是抓试点、重落地,确保设施建设“跑得通、用得好”。
首先是“奔着目标去”。要实现释放数据价值的目标,规模化流通是关键。实现规模化流通的一个重要前提是在不同行业、不同地域的主体之间建立共识,形成统一的标准和技术架构。“十四五”期间下发的《国家数据基础设施建设指引》,制定了数据基础设施参考架构、明确了“三统一”的互联互通要求,提出了匿名化处理等9项重点技术规范。截至目前,已经建成包含北上广深杭等25个城市在内的城市节点,布局了16个省(区、市)的数据基础设施架构,并在7月底全面完成互联互通。预计到今年年底,节点城市规模将扩大到50个左右,覆盖80%的省(区、市),为数据规模化跨域流通奠定设施基础。
其次是“盯着问题来”。数据领域的共性难题或痛点,包括“找数用数难”“规模流通难”“跨域加工难”等,针对这些难题,国家数据局组织了可信数据空间、数场等六大技术路线的创新探索,通过加快推动与数据基础设施紧密相关的关键技术攻关、典型应用场景适配,以及统一标准验证工作,目前已实现数据“一点发布、全域可见”,应用“一点部署、跨区通用”。例如,今年3月,国内7家科学数据中心联动,通过标准化数据基础设施搭建,将过去散布在各个单位的分散数据有机聚合,将数据处理效率提升了6.5倍,极大促进了多学科联合创新工作。
最后是“围着产业转”。“十四五”期间,我国数据基础设施建设吸引了数据交易所、数据开发商供数、治数、用数等各类主体,接入单位数量超过2000家。在设施标准制定方面,有产学研1200余家单位积极参与,广泛凝聚共识;在设施应用方面,支撑政务治理、金融风控等上百个场景应用,上架了近万个数据产品,形成了以数据基础设施建设运营、安全支撑为重点的良好产业发展态势。
“应该说,数据基础设施建设还处于起步阶段。”夏冰表示,面向“十五五”,要进一步聚焦高质量的标准构建、大规模的设施部署、市场化的生态运营,持续打造便捷高效、自主安全、世界领先的国家级数据基础设施,有效支撑数字经济发展、科技创新和全国统一大市场建设。
持续推进高质量数据集建设
算力是骨骼,算法是神经,数据是血液。作为人工智能发展的三大核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,特别是高质量数据集的建设。国家发展改革委党组成员、国家数据局局长刘烈宏举例道,在医疗健康领域,通过标注的医学影像高质量数据集,模型的疾病诊断准确率可提升15%以上。
在人工智能时代,Token作为处理文本的最小数据单元,如同互联网时代的“流量”。2024年初,我国日均Token消耗量为1千亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间内增长了300多倍,反映了我国人工智能应用规模的快速增长。
人工智能的快速发展与我国高度重视数据工作是密不可分的。我国是第一个把数据作为生产要素的国家,多措并举促进数据资源的开发利用。“‘人工智能+’行动到哪里,高质量数据集的建设和推广就要到哪里。”刘烈宏强调。
截至今年6月底,我国已建设高质量数据集超过3.5万个,总体量超过400PB(1PB可存储约5亿张2MB大小的高清照片)。人工智能模型的训练推动了数据交易需求的攀升,截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到246PB。以北京数交所为例,高质量数据集占交易总量的比例从去年的10%跃升到目前的近80%。
上海、天津及安徽等地正在试点“数据语料作价入股”等新模式,引导企业将高质量数据集折算为股权投入到相关企业。此外,高质量数据集的发展需要数据标注产业的支撑,我国已布局成都、沈阳、合肥等7个数据标注基地,助力高质量数据集的建设。
“中文数据在国内大模型的训练性能提升方面发挥着重要作用。”刘烈宏补充道,经过一段时间的努力,国内多数模型训练使用的中文数据占比已经超过60%,有些模型甚至达到80%。中文高质量数据的开发和供给能力持续增强,推动了我国人工智能模型性能的快速提升。
下一步,我国将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济和生物制造等重点领域数据高地。同时,还将推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。
数据资源量质齐飞
“十四五”时期,无论是全社会对数据资源重要性的认识,还是数据资源管理制度建设以及开发利用的成效和水平,都达到了全新高度。国家数据局副局长陈荣辉在会上对此进行了详细介绍。
首先,数据规模持续扩大。从全国数据资源统计调查情况来看,2024年我国数据生产量达到41.06泽字节,相当于1564万个中国国家图书馆的数据资源总量。41.06泽字节,从纵向看,比“十三五”末翻了一番多;从横向看,占全球数据总量的26.67%。数据资源爆发式增长,既反映了我国经济总量持续增长,经济发展持续向好,综合国力不断提升,也反映了数字中国建设深入推进,数字化、网络化、智能化进程加速。
其次,数据资源供给更加开放。在公共数据方面,印发《关于加快公共数据资源开发利用的意见》,并实施了资源登记、授权运营、价格机制等相关政策,形成“1+3”的政策体系。《政务数据共享条例》出台实施,省市两级制定公共数据授权运营的相关政策超过87项,政务数据共享、公共数据开发和授权运营更加规范和高效。国家公共数据资源登记平台登记的资源、产品和服务快速增长,目前已覆盖超过78个国民经济大类,覆盖数据体量超过6PB,提供了便利权威的找数用数渠道。在企业数据方面,推动可信数据空间的试点,实施国有企业数据效能提升行动,形成打破数据孤岛、促进要素流通的政策“组合拳”。
再者,应用场景不断丰富。以场景为牵引,打造“数据要素×”、公共数据“跑起来”等品牌,目前已发布70个示范场景,覆盖智慧农业、医疗健康及交通物流等重点行业领域,形成了一批可感可及的应用成果。从行业看,基于气象数据开发的产品和服务超过1.4万个,支撑了近13万个应用场景;医保部门通过海量数据分析精准识别欺诈骗保的线索,有力保障了医保基金的安全。从地方看,一些城市开展政企数据合作,实现了对道路信号灯的智能调控,助力破解拥堵难题。从市场看,服装企业利用消费数据,开展个性化设计生产,从设计下单到生产再到发货最快只需要3~7天,数据驱动的柔性供应链模式让中国制造更具竞争力。
陈荣辉说,我国数据事业恰逢人工智能高速发展的历史机遇,推动数据资源开发利用从“量的积累”向“质的飞跃”,需要政策体系、市场机制、场景应用和技术创新协同发力,也需要社会各界共同推进。(何 珺)