火山引擎申请用于生成问答数据的专利,能够自动生成高质量标注数据集

金融界 2025-01-28 15:18:16

金融界2025年1月28日消息,国家知识产权局信息显示,北京火山引擎科技有限公司申请一项名为“用于生成问答数据的方法和装置、设备、介质和产品”的专利,公开号CN119358604A,申请日期为2024年12月。

专利摘要显示,公开了用于生成问答数据的方法和装置、设备、介质和产品,涉及语言模型、大语言模型技术领域。该方法包括在从日志提取的问题之中,基于问题的问题清楚性选择第一问题。还包括在第一问题之中,基于第一问题的问题元信息选择第二问题,第二问题的数目小于等于第一问题的数目。还包括基于来自数据库的真值答案项,为第二问题指派真值答案。还包括基于由语言模型生成的模型答案项,为第二问题生成模型答案。还包括基于真值答案与模型答案之间的比较,将第二问题与真值答案和模型答案中答案差异性满足差异性阈值的一个或多个答案相关联存储以生成问答集。如此,能够自动生成高质量的标注数据集,保证问题清晰且具有针对性以及答案的覆盖面和准确性。

天眼查资料显示,北京火山引擎科技有限公司,成立于2020年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本100000万人民币,实缴资本35000万人民币。通过天眼查大数据分析,北京火山引擎科技有限公司共对外投资了5家企业,参与招投标项目334次,专利信息877条,此外企业还拥有行政许可8个。

本文源自:金融界

0 阅读:8
金融界

金融界

财经媒体、互联网金融、财富管理