金融界2024年12月21日消息,国家知识产权局信息显示,广州视源电子科技股份有限公司申请一项名为“一种多音字消歧方法、装置、设备及存储介质”的专利,公开号CN119150853A,申请日期为2023年6月。
专利摘要显示,本发明公开了一种多音字消歧方法、装置、设备及存储介质,本发明在获取到目标文本后,首先确定出目标文本相对应的编码序列以及目标文本中目标多音字的目标位置,之后再将编码序列和目标位置输入到预设的语言模型中,由语言模型提取出目标多音字的高维表征向量,最后将高维表征向量输入消歧分类器模型中,通过消歧分类器模型和掩码向量来输出目标多音字的目标发音。本申请在语言模型和消歧分类器模型的训练过程中,使用了词性分类器模型进行辅助训练,通过在训练的过程中加入词性的辅助信息,能够提升多音字消歧模型的准确性,同时在推理阶段也无需经过词性分类器模型输出词性,节省了时间,提高了对目标多音字的目标发音进行预测的效率。
本文源自:金融界