2026-06-20 15:51 点击次数:92

海天瑞声CTO黄宇凯。东说念主民网记者 翁奇羽摄
东说念主民网自贡6月17日电 (记者焦磊)6月16日,由东说念主民网主持的2026东说念主民数据大会在四川省自贡市举行。海天瑞声CTO黄宇凯在主旨发言中暗示,高质地数据集是东说念主工智能模子能力栽种的紧迫基础,鼓舞高质地数据集接济,需要从总体野心、工程化接济、质地评测和产业生态等方面协同发力。
黄宇凯暗示,高质地数据集可径直用于开导和磨练东说念主工智能模子,是能有用栽种模子性能的数据聚积,具有范围大、质地高、安全牢、不雅点正、成果好、应用广等中枢本性,是大模子能力的基础,也决定了模子能力的上限。
黄宇凯合计,高质地数据集接济应受命“总体野心、分步实施,先易后难、先简后繁”的原则。他暗示,数据是东说念主工智能的关节基石,也干系企业和组织里面多部门、多系统协同,需要顶层假想和训导。
关于围绕接济旅途,黄宇凯暗示,高质地数据集接济需要从供给侧和需求侧两个标的发力。从供给侧看,应站在数据产物和数据办事角度,在数据坐褥、数据措置、数据供给等方面加大插足;从需求侧看,则应站在东说念主工智能赋能各行业、各场景落地的角度,以应用需求牵引数据接济、开释数据价值。两者之间,国产av在线观看需要通过数据时刻、数据办事和数据生态协同供需两头,促进东说念主工智能产业高质地发展。
委果数据空间接济与行业高质地数据集接济密切洽商。对此,黄宇凯暗示,围绕国度数据局鼓舞的委果数据空间,不错从个东说念主、企业、行业、城市、跨境等不同层面伸开,字据不同委果数据空间面向的应用场景,需要数据提供方、使用方、办事方、运营方和监管方等多方共同参与。
黄宇凯先容,在文旅行业,海天瑞声也在多个景区推动多模态伴游助手应用,应用景区文本、图片、视频等数据,连络具体应用场景打造文旅行业高质地数据集,推动导览办事从被迫反馈向主动办事、从通用谜底向深度体验升沉。在数字东说念主界限,围绕直播带货、品牌宣传、动画游戏、文化实行等不同场景,也存在文本、声息、视频等多模态定制化数据需求。
据先容,海天瑞声配置于2005年,长期专注于东说念主工智能高质地数据集能力接济和产物办事,已累计造成1800多个数据集,办事大家向上1200家客户。
黄宇凯暗示,连络东说念主才资源、数据资源和工程化、范围化智能平台能力,合手续构建高质地数据集,将有助于东说念主工智能更好赋能千行百业。