首次全国数据工作会议于4月1日到2日在北京召开。会议就围绕数据要素市场化配置改革,统筹数字中国、数字经济、数字社会建设发展等,研究部署今年的重点工作。
国家数据局将开展数据标注基地试点,数据标注为人工智能模型的训练和优化提供基础,这家公司通过线上任务分派平台为中小型客户进行标注服务,另一家产品通过数据标注、清洗、脱敏、脱密、标准化提升数据质量。
图源:网络
一、数据标注为人工智能模型的训练和优化提供了基础
数据标注是机器学习和人工智能领域中的一个重要环节,它指的是对原始数据进行分类、标记或者注释的过程,以便于机器学习模型可以从中学习并做出预测或决策。在数据标注过程中,通常需要人工对数据进行分类和标记,例如对图片中的物体进行识别并标记出物体的边界框,或者对文本数据进行分类标记等。这些经过标注的数据被称为训练数据,它们是训练机器学习模型的基础。数据标注为数据加工的一部分。
数据标注的目的是为了提供高质量的数据集,以提高机器学习模型的准确性和性能。通过人工标注,可以确保数据的准确性和一致性,从而提高模型的泛化能力和鲁棒性。数据标注可以应用于各种类型的数据,包括文本、图片、音频和视频等。在不同的应用场景中,数据标注的方法和工具也有所不同。例如,在自然语言处理领域,数据标注可能包括词性标注、实体识别、情感分析等;在计算机视觉领域,数据标注可能包括图像分类、目标检测、语义分割等。
二、机构预计2029年中国数据标注行业规模超200亿元
根据华经情报网的分析,2021年中国数据标注行业的市场规模达到了43.3亿元人民币。国内数据标注行业以定制化服务为主,标准化产品占比较低。2021年,定制化服务的市场份额达到了85.41%,而标准化数据集产品仅占13.33%。2021年中国数据标注行业下游需求中,计算机视觉类、智能语音类和NLP类需求的占比分别为45.3%、40.5%和14.2%。预计到2029年,中国数据标注行业的市场规模将增长至204.3亿元人民币。
三、相关上市公司:汇洲智能、三维天地
汇洲智能:公司通过线上任务分派平台为中小型客户进行便捷、低廉的内容审核、标注服务;通过自研人工智能审核系统,增加人员审核效率和准确率率,为客户进一步节省在内容安全方面的支出成本。
三维天地:2022年半年报显示公司的一主营业务、数据资产管理软件通过构建全面有效的、切合实际的管理体系,一方面规范数据资产采集、整理、聚合、加工,通过数据标注、清洗、脱敏、脱密、标准化提升数据质量,保障数据安全,另一方面丰富数据资产应用场景,建立数据资产生态,持续运营数据资产,显性数据资产价值,为政府机构与企事业单位进行资产计量确认提供了良好的数据条件和能力基础,进一步推动数据要素流通,加速要素市场化。
免责声明及风险提示:以上分享素材,内容大部分来源于互联网公开渠道,版权归原作者所有(文章内容如涉及作品内容、版权图片、侵权、谣言或其它问题,请及时与我联系删除,第一时间保障您的权益),分享内容仅供参考学习,不保证该信息的准确性和完整性,不作为指导依据,不构成任何投资建议!!!
投资者据此操作,风险自担。 股市有风险,投资需谨慎 !!! !!!