今天(24日),在第七届数字中国建设峰会上,《全国数据资源调查报告(2023年)》正式发布。这是我国首次对数据资源进行“全面体检”。根据国家数据局等多部门的最新调查结果,我国数据生产的规模优势基本形成。
我国数据年产量相当于千万个国图的数字馆藏
国家工业信息安全发展研究中心主任蒋艳:随着5G、AI技术的快速发展,内容制作、影像视听等民生消费领域的新的业态不断涌现,随之带来的非结构性数据对我国数据总规模的贡献是巨大的。
与此同时,调查发现:在2023年全年生产的数据量中,只有2.9%被存储,这意味着一些数据在源头就被抛弃;另外,在存储数据中,一年未使用的数据占比约为四成,这说明不少数据被存储后不再被读取和复用。
北京交通大学信息管理理论与技术国际研究中心教授张向宏:数据生产多、存储少,这是一个全球的普遍规律,数据就像我们的水果一样,容易腐烂而会失去价值。当然从另一方面也说明,我国在数据资源开发利用方面还有待于进一步提高。
算力规模增长快智能算力占比约30%
算力,被称为人工智能的“发动机”,是新质生产力。新出炉的《全国数据资源调查报告(2023年)》显示,我国算力规模增长快,大模型计算需求不断增加。
到2023年年底,全国2200多个算力中心的算力规模约为230百亿亿次浮点计算/秒(EFLOPS)。什么概念?这可以让100辆新车的上万次碰撞测试在1分钟内完成。在过去的2023年,全国算力规模同比增长约为30%。目前,在所有算力中,智能算力占比提高到约30%。
中央财经大学中国互联网经济研究院副院长欧阳日辉:智能算力的需求增长这么快,主要来自大模型的发展,我们的通用大模型发展很快,行业的垂直的这种大模型发展也很快。比如说,我们在金融行业、医疗行业、政务领域里面,对智能大模型和智能算力的需求是越来越大。
在算力的区域分布上,最新调查结果显示,京津冀、长三角、珠三角地区的算力规模占比达到近60%,东部地区的数据存储和计算利用率要高于西部地区。
2023年我国公共数据开放量同比增长16%
公共数据,是数据领域中最大的“富矿”。《全国数据资源调查报告(2023年)》显示,我国公共数据开放共享已经初见成效。
.
中央财经大学中国互联网经济研究院副院长欧阳日辉:我们看到公共数据对外开放的量增速非常快,也可以看到公共数据获取的渠道和场景越来越丰富。
今年以来,记者注意到,不少地方纷纷成立“数据集团”,加快盘活公共数据。不过整体来看,现有的数据供给难以满足当下旺盛的需求,例如,在数据交易机构中,消费民生领域数据产品购买方数量是供给方的2.4倍。
国家工业信息安全发展研究中心主任蒋艳:随着数据技术快速发展,数据基础制度不断完善,数据产业发展壮大,数据资源开发利用水平不断提升,供需不匹配的现象将在一定程度上得以缓解。