金融界2024年12月21日消息,国家知识产权局信息显示,国网智能电网研究院有限公司申请一项名为“一种私域半结构化知识表示方法、系统及相关装置”的专利,公开号CN119150962A,申请日期为2024年9月。
专利摘要显示,本发明公开一种私域半结构化知识表示方法、系统及相关装置,属于自然语言处理技术领域,方法包括:获取的表格文本序列;利用OCR或文档解析获取所述表格文本序列的Markdown形式文本序列,并利用启发式规则进行粗粒度的表格格式修正;采用预先训练的表格类别判别模型对格式修正后的表格进行类别判定,得到分类结果和类别概率;根据所述分类结果和类别概率,并利用教师模型进行表格知识蒸馏得到表格知识文本;基于模型自检的投票机制,从所述表格知识文本中投票出教师模型最认可的表格知识的最后文本表示。该方法提高了私域半结构化知识表示的完整性和准确性,对表格知识候选进行打分,增加了方法的容错,提升了鲁棒性。
本文源自:金融界