金融界2024年11月14日消息,国家知识产权局信息显示,海南车智易通信息技术有限公司申请一项名为“一种基于少量标注数据的魔盒相关性训练样本增强与扩充方法”的专利,公开号CN118940089A,申请日期为2024年7月。
专利摘要显示,本发明属于搜索引擎技术领域,且公开了一种基于少量标注数据的魔盒相关性训练样本增强与扩充方法,该方法的具体步骤包括;步骤一,项目初期:快速构建训练框架与基础样本生成;步骤二,项目中期:人工介入与样本质量提升;步骤三,项目提升阶段:持续优化与样本扩充;步骤四,模型层面优化:对比学习样本增强。通过结合自动化标注和人工标注,实现了对大量数据的快速处理和高质量标注,自动化标注工具能够快速处理海量数据,减少人工标注的负担,而人工标注则能够确保难分样本和关键样本的准确性,通过设定动态阈值和混合策略,进一步提升了标注数据的多样性和代表性,使得模型能够学习到更加全面和深入的特征。
本文源自:金融界