微软发布DragonV2.1模型：AI转录语音更自然，单词错误率平均下降12.8%、支持合成超100种语言

来源： aicg搜索日期：2025-08-06 09:15:58

aicg搜索 → 首页 → AI教程资讯 → 微软发布DragonV2.1模型：AI转录语音更自然，单词错误率平均下降12.8%、支持合成超100种语言

7月31日消息，科技媒体NeoWin今天（7月31日）发布博文，报道称微软推出了DragonV2.1Neural零次学习（Zero-ShotLearning）模型，仅凭少量数据就能创建更加自然、表现力强的声音，并支持超过100种语言。

援引博文介绍，这是一种零次学习的文本到语音（TTS）模型，承诺提供更加自然和富有表现力的声音，并提高了发音的准确性以及增强了可控性。

新模型仅需几秒钟的语音样本即可合成超过100种语言的语音。相比之下，之前的DragonV1模型在处理专有名词时存在发音问题。DragonV2.1模型可以应用于多种不同场景，包括定制聊天机器人声音和为视频内容跨多语言配音。

微软表示，DragonV2.1提高发音准确性，与DragonV1相比，该模型单词错误率（WER）平均降低了12.8%。

该模型还提升了声音的自然度，用户使用此模型时，可以利用SSML音素标签和自定义词典对发音和口音进行细致控制。为了帮助用户入门，微软构建了Andrew、Ava和Brian等多个声音档案，供用户测试。

读完这篇文章后，您心情如何？

0 喜欢
0 顶
0 无聊
0 围观
0 囧
0 难过

相关资讯

推荐阅读

网友评论

热门评论

最新评论

相关推送

: 1博特妙笔查看 2星穹智绘查看 3Cascadeur--基于人工智能技术的AI辅助动画制作K帧软件查看 4 Decoherence查看 5 蛙蛙写作查看 6So-VITS-SVC查看 7WellSaid Labs查看 8Clipchamp查看

浏览排行

AI使用攻略: 更多+

1全新通用大模型Gemini基准测评30项碾压GPT-4，谷歌演示视频上演现实版的“贾维斯” 2特朗普：三家企业将投资5000亿美元建设AI基础设施 3张旭代表：把北京建设成人工智能赋能科学研究的全球中心城市 4全球首例AI侵犯知名IP形象宣判！广州法院判决AI生成奥特曼侵犯圆谷著作权 5全国人工智能应用场景创新峰会在深圳举行 6马斯克宣布开源Grok AI大模型丨三星“泄密”Windows 11多项AI新功能丨ChatGPT耗电惊人≈1.7万家庭 7“零一万物”宣布开源Yi-9B模型，号称同系列内代码、数学能力最强，能在消费级显卡上轻松部署 8苹果发布M3芯片MacBook Air：号称最强AI笔记本丨全国两会代表群策AI大模型落地丨SD3的研究论文公开

CG艺术长廊 | AI技术前沿 | 创新应用案例 | 行业深度解析 | 搜索技巧指南 | 社区互动论坛 | AI教程资讯 | 网站地图

Copyright 2009-2016 //www.aisoh.cc/ 版权所有

返回顶部