人工智能发展需要三大基础要素:算法、算力和数据。其中,数据是重要基础,无论是图像识别、语音语义还是视频监控,都离不开数据支撑。数据标注作为数据加工的一种方式,是对未经处理的语音、图片、文本、视频等初级数据进行加工处理, 并转换为机器可识别的信息,可运用于智慧交通、智慧医疗、智能语音、智慧安防等众多人工智能应用场景中,同时对建设数字经济和数字社会具有重要意义。
进入人工智能时代,行业的发展越来越离不开数据的支持,随着国内人工智能产业发展如火如荼,数据采集与标注需求不断增加,促进了行业繁荣。2021年,国际数据公司IDC首次发布中国人工智能基础数据服务市场追踪报告。报告预测,到2025年,中国人工智能数据采标服务市场规模将达到123.4亿元人民币。
(图片来源:IDC官网)
据IDC分析,当前人工智能数据服务市场的产业链并不冗长,已有成规模的数据标注服务商。随着市场的竞争,规模化效应将更加突出——成规模的平台型厂商将占据越来越高的市场份额。
(图片来源:IDC官网)
素有中国科技第一展之称的中国国际高新技术成果交易会(简称“高交会”),是中国高新技术领域规模最大、最富时效和最具影响力的品牌展会,已连续举办二十三届。位于高交会1号馆的信息技术与产品展(简称“IT展”),是高交会中最大规模的专业产品展,展示面积达30000平方米。展馆设置人工智能、数字经济、智能制造、智慧生活四大主题展区,IT抗疫科技和5G商用及物联网两大专区。人工智能展区作为IT展亮点展区之一,重点展示AI前沿技术应用和科技成果。其中,北京深度搜索科技有限公司(简称“倍赛科技”)和北京云测信息技术有限公司(简称“云测数据”)作为人工智能领域成规模的数据标注服务商,以其成熟的数据标注技术,有力助推行业数字化转型。
倍赛科技是国内第一家完成产业链闭环的AI数据公司,拥有标注和建模双引擎,以及从数据标注到模型训练的AI全生命周期服务与软件生态体系。在计算机视觉领域,对于图像语义分割的标注,常有轮廓处理难以贴合,影响数据输出质量的难题。针对此行业痛点,倍赛科技以可控的共享边方案,实现多边形共享功能。通过标注轮廓相邻的轮廓上的两个顶点,对顶点间的片段进行复用,规避了复杂图形的处理,从而实现与相邻轮廓的紧密贴合,极大程度提高了数据标注效率和准确率。
(图片来源:倍赛科技官网)
云测数据是Testin云测旗下AI训练数据服务品牌。为实现数据在个细分领域的深层次应用,云测数据首创“场景数据实验室”,在音频领域,开发“音频检测”功能,以保证底噪和能量值在阈值范围之内,这种对音频数据的预处理方式可大幅提升数据的采集质量并切实提升数据采集的效率。
(图片来源:云测数据官网)
同时,云测数据还在横店设置了“数据场景实验室”,通过AI技术快速搭建各类复杂场景,对群演进行特定动作和表情捕捉,达到多角度多姿态的采集,实现更佳的场景还原。云测数据通过工程化的赋能,提供多维度、场景化的数据服务,将为人工智能场景化落地输送更多数据支撑。
(图片来源:云测数据官网)
作为人工智能发展道路的基石,数据价值的积累不断夯实人工智能基础,数据标注也将快速发展,为数字化转型提供更多新动能。2022年11月15-19日(拟),第24届高交会IT展将在深圳会展中心1号馆盛大举办,届时在不同的亮点展区,将有涵盖人工智能各细分领域的数据奥秘等您来探索。
除人工智能领域的精彩展示之外,高交会人工智能板块创新论坛--中国国际人工智能领袖峰会(简称“AIC”)将于高交会同期举办。作为高交会IT展的专业技术论坛,致力于为政府部门、企业精英和专家学者提供一个高层间对话,聚焦行业前沿及当下热点,引领行业转型,推动人工智能产业的持续发展与进步。
科技改革驱动创新,科技创新驱动发展。欢迎所有科技类企业莅临参展,同时也欢迎广大企业前来观展,共襄盛举!