希鸥网观察发现,继算力基础设施迎来价格重构后,人工智能产业的另一核心支柱——数据,也正迎来国家级的规范化推动。近日,国家数据局发布公告,就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》向社会公开征求意见,此举被视为加速AI产业从“算力军备竞赛”迈向“数据质量深耕”的关键一步。
行业高质量数据集是经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,并能有效提升模型、智能体、智能终端等应用效能的行业数据的集合,包含行业通识和行业专识数据集。
方案提出了明确的目标:到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设标准和工具。
在建设重点方向上,方案展现出极强的前瞻性。首先,面向人工智能预训练、强化学习等阶段,将持续推进文本、图像、音频、视频等多模态高质量数据集建设。其次,面向智能体等新型智能应用形态,将加强知识库、知识图谱、本体等数据集建设。再次,面向具身智能发展需求,将加快重点场景物理交互、环境感知、运动控制等真机交互数据集建设,并积极布局世界模型等前沿方向的数据集建设。
在商业模式创新方面,方案提出了从基础数据包销售向API调用、模型化解决方案及全栈服务的梯次跃升。尤为值得关注的是,方案明确提出要探索词元交易等新型数据集交易模式,构建以词元为基础,可量化、可定价的数据集价值体系。这标志着数据的价值衡量将与AI模型的实际使用深度绑定,进一步推动数据要素市场的成熟。
希鸥网观察认为,数据作为AI的“燃料”,其质量直接决定了人工智能发展的上限。国家数据局此次征求意见稿的发布,不仅为数据产业指明了标准化、高质量的发展路径,更通过探索词元交易等新模式,为数据资产的定价与流通打开了想象空间。这将有力促进AI产业从单纯的算力堆砌,转向算力与数据双轮驱动的高质量发展阶段。
(本稿件整理自网络公开报道,将同步发布希鸥网、创新日报、锐CEO网、NasdaqLtd观察网、斯贝瑞品牌资讯、AI联播等网站,编辑:张多金,微信号:meisceo29,写稿、投稿咨询联系我。)