AI语料是指用于训练、测试和优化各种人工智能(AI)系统和模型的文本、语音、图像等数据类型,涵盖多种语言和领域,旨在帮助AI系统学习如何与人类进行交互、如何回答问题、如何执行特定的任务等。随着AI应用场景的不断拓展,对高质量、多样化的语料数据需求也在不断增加。
数据资源
人民网
主流价值语料库建设领域龙头。
中国出版
学术文库、重点工具书等特色资源型项目数据化龙头。
中国科传
中科院旗下,国内学科分布最全、出版规模最大的综合性科技出版机构。
数据采集
太极股份
在政务大数据采集处理领域技术领先。
东方国信
提供数据采集、存储计算、分析挖掘等相关技术产品。
万达信息
国内城市信息化领域的领先企业。
数据标注
海天瑞声
中国语音类基础数据服务行业的市场份额排名前五。
云从科技
在数据确权领域技术领先。
数据应用
科大讯飞
世界领先的智能语音技术企业。
昆仑万维
自研“天工”大模型应用。
新华传媒
推出 SSP 线上语料库平台。