科大讯飞在2023年6月24日荣获国家科学技术进步奖一等奖,这是对其在多语种智能语音技术及产业化领域取得的突破性成果的高度认可。科大讯飞的这一成就,标志着其在人工智能领域的技术实力和创新能力已达到国际领先水平。
据「TMT星球」了解,科大讯飞的技术突破主要集中在四个方面,首先是复杂语音信号解耦建模,即科大讯飞提出了多通道语音信号时空分离建模方法,有效解决了远场、噪声、多人语音混叠等复杂场景下的语音识别难题,显著提升了识别准确率。
其次是多语种共享建模,面对小语种智能语音系统构建的挑战,科大讯飞设计了多语种通用音素体系,通过元学习和多语种预训练技术,显著提升了小语种语音系统的性能。
另外就是语音语义联合建模,科大讯飞提出了语音语义互增强的鲁棒口语理解技术,有效提升了语音交互和翻译的语义理解准确率。
最后是国产异构硬件平台训练及推理加速,面对国外高端智算芯片的断供,科大讯飞提出了软硬件协同优化的技术方案,解决了智能语音技术在国产硬件平台上的性能和适配问题。
这些技术成果不仅在国际权威评测中屡获佳绩,更在实际应用中展现出强大的市场竞争力和社会效益。科大讯飞的智能语音技术已广泛应用于智能手机、智能汽车、智能硬件等多个领域,有效推动了语音产业的发展和升级。
科大讯飞还积极构建自主可控的产业生态,通过多语种语音云平台和智能语音国家新一代人工智能开放创新平台,聚集了大量开发者和终端设备,推动了全球多语种技术生态的建设。同时,科大讯飞也致力于公益事业,通过"听见AI的声音"等公益行动,为听力障碍人士提供实时语音转文字服务,展现了科技企业的社会责任。
面向未来,科大讯飞将继续深耕智能语音技术,融合大模型技术,推动语音识别、合成和翻译的效果进一步提升。讯飞星火V4.0的发布,将为语音大模型带来全新升级,为各行各业提供更加智能化、个性化的AI助手,加速通用人工智能时代的到来,用人工智能建设更加美好的世界。
科大讯飞的这一成就,不仅是对其过去25年创业历程的总结,更是新征程的起点。在通用人工智能时代,科大讯飞将继续以技术创新为驱动,以产业应用为导向,不断攀登科技高峰,为建设美好世界贡献力量。