分享:
大模型时代,人工智能行业高质量数据集对于构建准确、高效、可靠的模型至关重要,高质量数据集不仅能够提升模型的泛化能力,还能减少过拟合的风险,使得人工智能系统更加稳健。
中国信息通信研究院(以下简称“中国信通院”)高度关注和重视人工智能行业高质量数据集建设,推动数据要素价值赋能区域发展。2025年3月21日,在无锡“2025未来产业生态大会暨文心中国行”上,中国信通院人工智能研究所所长魏凯、无锡市数据局局长胡逸、百度AI技术生态副总经理周奇共同启动“长三角人工智能数据高质量发展行动计划”。这项计划由中国信息通信研究院、无锡市数据局、百度三方联合发起,依托文心大模型(无锡)数据生态中心,通过人工智能高质量数据集建设赋能大模型各行业应用。
“长三角人工智能数据高质量发展行动计划”依托中国信通院高质量数据集评估评测,以及百度文心大模型数据精标、数据人才培育、数据产品开发等专业能力,以无锡为核心基点,向长三角地区全面辐射,以高质量数据作为核心驱动力,全力助推长三角地区政务、教育、智能制造、车联网、生物医药等关键产业实现高质量发展,为区域经济的转型升级与创新发展注入新活力。
中国信通院人工智能数据集质量评估测试旨在系统性地检查数据集的完整性、准确性、一致性以及多样性等关键属性,掌握数据深层知识价值,确保数据高质量供给,形成贯穿于大模型全生命周期的高质量数据闭环。中国信通院依托中国人工智能产业发展联盟(AIIA)和工信部人工智能关键技术和应用评测重点实验室,建立了“可信AI”人工智能数据集质量评估体系,搭建了“1+1+N”质量评估能力。目前已完成招商局集团、中国建筑等央国企数据集质量评估测试工作,取得良好成果。招商局集团、中国建筑分别作为交通领域、建筑领域内第一家完成高质量数据集评估测试工作的央企,其成果在相应领域内具有一定的标杆模范效应,为中国信通院后续的各领域数据集质量评估测试工作起到积极促进作用。
版权归属原作者,非商业用途,如有侵权,请联系删除