首个支持30种方言混说语音大模型亮相

来源:科技日报2024年06月17日 09:35

科技日报讯 (记者崔爽)记者6月16日获悉,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。

基于几亿用户和丰富应用场景优势,中国电信人工智能研究院构建了超30种、超30万小时的高质量方言数据库,推出星辰超多方言语音识别大模型。研发团队通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持方言种类最多、覆盖人口最多的语音大模型。

团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。星辰超多方言语音识别大模型也是业内首个开源的基于离散语音表征的语音识别大模型,将推理时语音传输比特率降低数十倍。

据悉,星辰超多方言语音识别大模型已在福建、江西、广西等地的智能客服试点应用。接入大模型后,智能客服能秒懂30种方言,日均处理约200万通电话。星辰超多方言语音识别大模型还落地多地市12345平台,为客服人员赋能,提升沟通效率,助力政务工作智能化升级。

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

能源之问 | 深耕采煤沉陷区新能源 助力海南新型电力系统建设
院士对话|“十五五”,氢能发展最好的切入点在哪里?
网传深圳比亚迪坪山工厂出现火情:浓烟滚滚,火势明显
院士对话:如何提升区域能源的自给率

精彩图集

力箭二号遥一运载火箭发射成功
美以伊战事30天——战争阴影下两座城市的日常
世界最大水下盾构隧道实现双层贯通
十四届全国人大四次会议第二场“部长通道”集中采访活动举行
首个支持30种方言混说语音大模型亮相
分享到: