全国20%人未普及普通话电信发布支持30种方言语音识别大模型

科技巴拉巴拉吧 2024-05-25 20:59:04

  近日,一项突破性的技术成果由中国电信人工智能研究院(TeleAI)发布——星辰超多方言语音识别大模型。这一创新模型支持粤语、上海话、四川话等30多种方言的自由混说识别,有效解决了智能客服在方言识别方面的难题。

  随着AI技术的不断进步,智能客服已成为我们日常生活中不可或缺的一部分。然而,对于许多习惯使用方言,尤其是只会说方言的老年人来说,与智能客服的交流往往存在困难。这一新发布的星辰大模型正是为了解决这一问题而诞生的。

  据统计,全国仍有大约20%的人口未普及普通话,这部分人群在享受智能信息服务时常常面临障碍。星辰大模型的推出,无疑为这部分人群打开了一扇通往智能时代的大门。

  星辰大模型不仅支持多种方言的识别,更在语音识别技术上取得了显著突破。通过超大规模语音预训练和多方言联合建模,该模型实现了在单一模型中支持30种方言的自由混说识别,成为国内支持方言种类最多、覆盖人口最广的语音大模型。

  值得一提的是,星辰大模型还采用了业内首创的“蒸馏+膨胀”联合训练算法,有效解决了超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,实现了1B参数80层模型的稳定训练。

  此外,星辰大模型还是业内首个开源的基于离散语音表征的语音识别大模型。其通过“从语音到token再到文本”的建模新范式,大幅降低了语音传输的比特率,进一步提升了语音识别的效率和准确性。

  星辰大模型的卓越性能已在多个国际权威赛事中得到验证。在INTERSPEECH2024离散语音单元建模挑战赛上,中国电信人工智能研究院语音团队凭借星辰语音识别大模型斩获了语音识别赛道冠军。同时,在业内知名的多方言语音识别数据集KeSpeech任务上,星辰语音大模型以高达92.97%的字准确率刷新了最优结果。

  目前,星辰语音大模型已广泛应用于中国电信的万号智能客服、翼声平台以及多地市的12345平台,显著提升了客服效率和用户满意度。未来,中国电信人工智能研究院计划进一步拓展星辰大模型的应用场景,并持续提高支持方言的数量和准确度,旨在让更多人享受到AI时代的便利。

0 阅读:8

科技巴拉巴拉吧

简介:感谢大家的关注