最先进AI工具生成声音与人声无异

来源:科技日报2025年09月29日 09:10作者:刘霞

许多人仍认为人工智能(AI)生成的语音听起来“机械感”明显,但英国伦敦玛丽女王大学研究团队在新出版的《公共科学图书馆·综合》杂志上发表论文指出,AI语音合成技术已进入新阶段,其生成的“克隆语音”或深度伪造声音,逼真度与真人录音无异。

研究团队采用当前最先进的AI语音合成工具,生成两类合成语音:一类是基于真人录音的“克隆”声音,旨在模仿特定说话者;另一类则由大型语音模型生成,不针对具体个人。参与者被要求辨别声音的真实性与可信度。

尽管研究未发现AI声音存在“超真实效应”(即比真人更像真人),但结果显示,“克隆语音”的逼真度已与真人声音不相上下,令人难以分辨。且部分AI生成的声音在可信度评价中甚至超越了真人录音。

研究团队表示,AI语音已渗透日常生活,如Alexa、Siri及各类客服系统。虽然当前系统音色仍具机械特征,但自然度接近人声的AI语音技术已然成熟。利用商用软件仅需几分钟真人录音,即可快速、低成本地生成高质量声音克隆,且几乎无需专业知识。

最新研究显示,公众对高仿真语音认知机制的研究迫在眉睫。AI语音技术的飞速发展有望给教育、人机交互等领域带来创新机遇——在这些领域,定制的高质量合成语音可增强用户体验。但是,合成语音也对伦理、版权和安全构成挑战,尤其在虚假信息、诈骗与身份冒用等方面需加强防范。

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

能源之问 | 深耕采煤沉陷区新能源 助力海南新型电力系统建设
院士对话|“十五五”,氢能发展最好的切入点在哪里?
网传深圳比亚迪坪山工厂出现火情:浓烟滚滚,火势明显
院士对话:如何提升区域能源的自给率

精彩图集

力箭二号遥一运载火箭发射成功
美以伊战事30天——战争阴影下两座城市的日常
世界最大水下盾构隧道实现双层贯通
十四届全国人大四次会议第二场“部长通道”集中采访活动举行
最先进AI工具生成声音与人声无异
分享到: