当前,Deepseek成为了像水电网一样的AI基础设施,也对高质量训练数据提出更大需求。全国人大代表、无锡SK海力士半导体(中国)有限公司高级工程师孙华芹,长期在产业一线和数据“过招”。她结合本职工作和一线的广泛调研,为数据标注产业高质量发展建言献策,让专业和履职“双向奔赴”。

作为来自集成电路产业生产一线的基层人大代表,孙华芹一直十分关注新兴产业的发展。在过去几年,她相继提出了加强培养半导体行业人才、促进充分就业等相关建议,部分建议得到了国家有关部门的重视和回复。今年,她关注的话题是——数据标注。标注工作好比是AI应用的基石,从人工智能机器学习到人脸识别自动驾驶等,都离不开这些基础数据。为此,孙华芹代表深入一线广泛进行调研,为全国两会做准备。
不久前,由无锡数据集团建设运营的无锡“算力超市”正式上线DeepSeek大模型。得知这一消息,孙华芹来到无锡数据集团有限公司,听取专业从业人员的建议。无锡数据集团有限公司副总经理史亦言告诉孙华芹:“企业最关注的是数据安全的问题,因为每家企业的数据都是自身的秘密和隐私,最好能够有一个公共服务平台,使得企业能够安全地把这些数据放心地放在平台上面,使得数据的权益能够得到保障。”
“因此,也需要我们的人大推进立法,去加速它的进程。”孙华芹频频点头, 将史亦言反映的情况详细记录在本子上。
孙华芹代表所在的企业里,也有很多数据相关专业的从业者。围绕数据标注产业的发展,大家也有自己的看法和疑惑。在调研中,有同事反映说:“现在很多AI的软件提供了很多的服务,未来他们之间是不是也要加强数据共享?”
孙华芹代表很受启发:“需要上下游的这种协同机制,包括供应商之间也需要加强沟通,才能更好地去协同未来的发展。”
积累了越来越多的资料和一线感受,也让孙华芹代表的建议更加丰满。孙华芹代表告诉记者,当前全国数据标注产业发展迎来了众多利好,去年底,《关于促进数据标注产业高质量发展的实施意见》对外发布,表明了国家对数据标注产业高质量发展的重视。

结合调研,她准备了《关于加大支持用于人工智能训练的高质量数据标注产业的建议》。针对调研中发现的当前数据标注领域缺乏统一、完善的标准规范体系,上下游的产业协同性不足,缺乏统筹规划与协同机制,现阶段大量的数据标注工作仍依赖人工完成容易受主观因素影响导致标注质量不稳定,同时数据安全管理和保障体系有待完善等问题。她建议,应该建立统一的规范标准,充分发挥国家数据标注基地引领作用,实现数据标注产业的全链条协同发展。加大培养兼具技术与行业知识的复合型人才。同时,还要建立健全数据标注产业的安全监管机制,为数据标注产业的健康发展提供有力保障。
“数据标注产业依然还在起步阶段,需要我们各行各业的人共同去提出建议,汇到一起后集中解决,未来这个产业一定会发展得越来越好!” 孙华芹代表说。
来源:江苏广电总台·荔枝新闻中心丨记者 周洋




