智库试点:2025年1月13日,国家发展改革委、国家数据局、财政部、人力资源和社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》),这是国家层面首次对数据标注这一新兴产业进行系统谋划,现编发相关内容,供业内参阅。
一、数据标注产业是什么?
什么是“数据标注”?狭义来说,数据标注是指对未经处理的原始数据添加说明、解释、分类或编码的过程,以便数据可以被人工智能算法所理解和使用。简单理解,就是给文本、语音、图片、视频等等各种各样的数据“打标签”。
什么是“数据标注产业”?具体而言,数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。它是人工智能模型训练的重要环节,通过将原始的非结构化数据转化为机器可识别的结构化数据,为模型的训练和学习提供必要的输入。数据标注的准确性、完整性和效率直接影响到人工智能模型的性能和表现。《实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
二、数据标注产业发展现状
应用场景丰富。从自动驾驶、医疗健康到智能制造、金融风控等领域,数据标注的应用场景日益丰富,为数据标注产业提供了广阔的市场空间。
我国已建设多家试点基地。国家数据局在第七届数字中国建设峰会上公布了7家全国数据标注试点基地名单,分别为四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定、山西大同。这些试点城市通过建设数据标注基地,正积极构建数据产业生态,吸引国内外投资,培育本土企业,推动数字经济与实体经济的深度融合。
但当前数据标注产业面临着诸多问题。例如,行业标准不统一、数据质量参差不齐、专业人才短缺等,严重制约了产业的进一步发展和人工智能技术的广泛应用。在此背景下,相关部门出台该实施意见,旨在解决产业痛点,促进数据标注产业的规范化、规模化、高质量发展。
三、政策文件概述
《实施意见》包括总体要求、主要任务、保障措施三个部分。总体要求包括指导思想、发展原则和发展目标。主要任务围绕深化需求牵引、增强创新驱动、繁荣产业生态、优化产业支撑四个方面提出相关政策举措。保障措施重点是建立健全工作机制、加强部门协同、强化政策实施与监督等。
资料来源:央广网(2025年1月14日)、经济日报微信公众平台(2025年1月14日)、清华大学智能法治研究院微信公众平台(2025年1月13日)、国统大数据微信公众平台(2025年1月13日)、数据资产最前线微信公众平台(2025年1月13日)