首页 资讯正文

NVIDIA的最新技术使人工智能的声音更具表现力和真实感

NVIDIA的最新技术使人工智能的声音更具表现力和真实感

亚马逊的Alexa、Google助手和其他人工智能助手的声音远远领先于老式的GPS设备,但它们仍然缺乏节奏、音调和听上去让人感觉真实的品质,NVIDIA公司在Interspeech2021会议上宣布,该公司已经公布了新的技术和工具,可以通过让你用自己的声音训练AI系统来捕捉这些自然的语音品质。

为了改进其人工智能语音合成,NVIDIA的文本-语音研究团队开发了一个名为RAD-TTS的模型,这是NAB广播大会上开发最逼真化身的比赛的获胜作品。该系统允许个人用自己的声音训练文字转语音模型,包括节奏、音调、音色等等。

RAD-TTS的另一个特点是语音转换,它可以让用户用另一个人的声音来传递一个说话者的话语。该界面可以对合成的声音的音调、持续时间和能量进行精细的、帧级的控制。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:https://www.chinaai.com/zixun/14319.html

发表评论

评论列表(0人评论 , 8766人围观)
☹还没有评论,来说两句吧...