阿里巴巴申请语音识别专利,实现目标识别文本书面化改写增强可读性

金融界 2024-12-19 10:50:11

金融界2024年12月19日消息,国家知识产权局信息显示,阿里巴巴(中国)有限公司申请一项名为“语音识别方法、会议语音识别方法以及语音翻译方法”的专利,公开号CN119132304A,申请日期为2024年7月。

专利摘要显示,本说明书实施例提供语音识别方法、会议语音识别方法以及语音翻译方法,其中所述语音识别方法包括:获取目标语音的初始识别文本和语音关联文本;将初始识别文本和语音关联文本输入文本生成模型,获得目标语音的目标识别文本,其中,文本生成模型基于样本文本对和样本文本对携带的样本关联文本训练得到,样本文本对包括初始样本文本和目标样本文本,目标样本文本为书面风格的文本。利用目标样本文本使得模型具备文本书面风格改写能力,在模型输入中添加语音关联文本,加深模型对初始识别文本的理解,实现了对初始识别文本的书面化改写,增强了目标识别文本的可读性。

本文源自:金融界

0 阅读:1

金融界

简介:财经媒体、互联网金融、财富管理