品玩8月17日讯,据 Arxiv 页面显示,由来自微软和哈尔滨工业大学等机构的学者们近日发布了一款语音生成模型SpeechX 。
据介绍,SpeechX 是一个多功能的语音生成模型,可以进行多种语音转换任务,并对噪声信号进行处理。SpeechX 结合了神经编码器语言建模和多任务学习,使用任务相关的提示进行统一且可扩展的建模,为语音增强和转换任务中利用文本输入提供了一致的方式。
实验结果显示,SpeechX在文本转语音、噪声抑制、目标说话人提取等各种任务中表现出较专门模型相当或更高的性能。

品玩8月17日讯,据 Arxiv 页面显示,由来自微软和哈尔滨工业大学等机构的学者们近日发布了一款语音生成模型SpeechX 。
据介绍,SpeechX 是一个多功能的语音生成模型,可以进行多种语音转换任务,并对噪声信号进行处理。SpeechX 结合了神经编码器语言建模和多任务学习,使用任务相关的提示进行统一且可扩展的建模,为语音增强和转换任务中利用文本输入提供了一致的方式。
实验结果显示,SpeechX在文本转语音、噪声抑制、目标说话人提取等各种任务中表现出较专门模型相当或更高的性能。