政协南通市第十三届委员会第四次会议
“构建加快发展新质生产力体制机制,塑造高质量发展新优势”专题建言献策会发言材料
关于加强人工智能领域高质量数据集供给的建议
九三学社南通市委会
人工智能是第四次工业革命的标配,已成为推动国家高质量发展的核心引擎。人工智能技术的快速发展,依赖于高质量数据集作为支撑,数据集如同人工智能的“粮食”,为其提供了学习与优化基础。在复杂的现实场景中,只有基于高质量的数据集,人工智能系统才能更加精准地识别、理解和预测世界,从而提供更加智能、高效的服务。因此,加强高质量数据集供给,将极大提升人工智能学习效率与准确性。
南通作为长三角一体化发展的重要节点城市,在抢抓产业变革机遇、布局未来产业中,应注重人工智能数据集供给企业引培。一是这类企业作为智力密集型产业代表,其运营特点鲜明:不依赖于高能耗高污染的生产模式,而是依托轻资产设备,通过高效的数据处理与分析,为人工智能的发展提供坚实的燃料。其绿色、低碳的特点,与南通追求可持续发展的战略目标高度契合。二是相比于当下热门的人工智能算力底座、大模型等产业,数据集产业的门槛较低,招商效费比高,可以同上海、苏州等先行城市定位差异化发展,建立产业合作、形成互补的竞争优势;三是人工智能数据集供给企业展现出极强的成长性和高附加值特性。随着AI技术的日益成熟和广泛应用,对高质量数据集的需求急剧增加,这类企业正处于行业风口之上,具有广阔发展前景与潜力。类比美国人工智能训练数据供应巨头Scale AI于2016年创立,5年后估值为70亿美元,2024年估值翻倍至140亿美元。四是这类企业入驻还将为解决南通及周边地区的就业问题提供有力支持。人工智能领域的数据集供给工作需要一支具备高度专业技能和创新能力的人才队伍。因此,随着企业高速壮大,将直接带动南通固定就业岗位数量飞增。同时,由于数据标注项目具有临时性特点,项目执行期间往往要组建近千人的临时团队,对于南通的灵活就业市场也具备较强促进作用。
南通对于人工智能数据集企业落户也具备较强吸引力。一是区位优势显著。南通地处长三角一体化发展核心区,交通便利,距离上海、杭州、苏州、无锡等人工智能发展先行城市较近,利于企业跨区域承接上游订单,同时房租、工资等企业硬性成本支出较低。二是教育资源丰富。南通为教育之乡,拥有多所高校与高职院校,劳动人群能力素质相对较高,对于人工智能数据集供给企业实行产教结合、培训数据标注人才方面较为便利。三是智算中心建设初见成效。目前市区多个智算中心项目已开工建设,未来我市将拥有较为廉价的本地智算资源能为企业提供强大的算力支持和数据服务,这对于数据集供给企业而言也具有较大吸引力。
目前,在人工智能三大要素(算力、算法与数据)的竞争中,中美双方在算力、算法方面差距不大,但在高质量多模态训练数据供给方面却存在较大距离,亟需补齐短板。为进一步加强高质量数据集供给企业的招引落地,建议:
一是加大招商力度。重视人工智能产业招商工作,并针对高质量数据集供给企业开展精准招商。面向海天瑞声、数据堂、小马数据、标贝等行业龙头企业举办专题招商会,积极宣传本地的产业优势、政策环境和发展前景,吸引更多优质企业、创业团队前来考察和投资。鼓励市属国有企业通过项目合作、资源共享、入股共建等方式开展招商,加速企业落户。
二是强化人才、数据资源支撑。加大人才引培力度,针对人工智能数据集产业,强化高职教育,通过产教结合为企业提供充足的人才保障。建立健全人才激励机制,鼓励高校、科研院所与企业合作开展人才培养和科研项目,形成产学研用深度融合的发展模式。进一步扩大公共数据集的整合范围,提高数据供给与流通效率,建立一套授权具备相关资质的数据集企业深度开发公有数据的机制。积极落实《国家数据要素三年行动方案》,制定行业数据开放标准,推动企业开放行业数据,以促进数据要素流通和应用。
三是优化财政奖补政策。制定和完善针对人工智能高质量数据集供给企业的财政奖补政策,特别针对核心研发团队在当地落地的企业给予重点支持。同时,建立科学评估机制,确保奖补资金有效使用与政策持续激励作用。