谷歌正在研究能够让计算机合成语音更加自然的技术
3月28日,据国外媒体报道,谷歌研究院正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员本周二在博客中公布了一些能让语音更具有表现力的方法示例。
同时,谷歌发布了“云端文本转语音”服务的测试版,提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术,这个技术可以被用于生成非常自然的声音。
有报道显示,谷歌研究员近期发表了两篇论文,提出了新的发音方法,介绍了如何模仿语音中的重音或语调。这两篇论文的技术都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系统,使用神经网络进行训练,模仿人类语音。
Tacotron在大部分情况下都可以模拟真人声音,但是却无法模仿说话中的重音和自然语调。Tacotron的联合发明人Wang Yuxuan参与了其中一篇论文研究。研究通过将人类语音片段嵌入计算机语音风格,使合成语音中实现了重音等效果。另一篇论文的研究则使用无监督训练和识别语音模式,并模仿某些语音风格。
在语音技术研发上,去年苹果Siri被众多消费者认为是更加具有表现力的声音。同时去年四月,亚马逊Alexa面向语音应用开发者提供了SSML标签,在语音助手中增加了更丰富的表达,例如停顿、轻语,以及一些感叹词等。
最新活动更多
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论