消息称亚马逊开发出最大的文本转语音模型

2024-02-19 09:18:22
分享

2月19日消息,据报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音(来自公共网站)来进行训练,其中大部分为英语语音,但也包括德语、荷兰语和西班牙语,这使它成为自然语音的新标准。研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。

更加详细情况,请关注本站最新动态。