Time to Speak Some Dialects, Qwen-TTS!
API 简介 我们通过 Qwen API 更新了 Qwen-TTS ( qwen-tts-latest or qwen-tts-2025-05-22 ) 的最新版本。Qwen-TTS 使用了超过 300 万小时的大规模语料库进行训练,合成效果实现了人类级别的自然度和表现力。比较亮眼的是,Qwen-TTS 会根据输入文本自动调整韵律、节奏和情绪变化。此外,Qwen-TTS 支持生成三种中文方言,包括北京话、上海话和四川话。 目前,Qwen-TTS 支持七种中英双语音色,包括 Cherry、Ethan、Chelsie、Serena、Dylan(北京话)、Jada(上海话) 和 Sunny(四川话),更多语言和风格选项即将在近期推出。 中文方言样例 这里有一些样例展示了 Qwen-TTS 在中文方言上的自然生成能力。 音色 方言种类 文本 合成样例 Dylan 北京话 我们家那边后面有一个后山,就护城河那边,完了呢我们就在山上啊就其实也没什么,就是在土坡上跑来跑去,然后谁捡个那个嗯比较威风的棍,完了我们就呃得瞎打呃,要不就是什么掏个洞啊什么的。 得有自己的想法,别净跟着别人瞎起哄,多动动脑子,有点儿结构化的思维啥的。 Jada 上海话 侬只小赤佬,啊呀,数学句子错它八道题,还想吃肯德基啊!夜到麻将队三缺一啊,嘿嘿,叫阿三头来顶嘛!哦,提前上料这样产品,还要卖 300 块硬币啊。 侬来帮伊向暖吧,天光已经暗转亮哉。 Sunny 四川话 胖娃胖嘟嘟,骑马上成都,成都又好耍。胖娃骑白马,白马跳得高。胖娃耍关刀,关刀耍得圆。胖娃吃汤圆。 他一辈子的使命就是不停地爬哟,爬到大海头上去,不管有好多远! 额外结果 Qwen-TTS 生成的效果目前已经达到了人类水平,其在 SeedTTS-Eval 评测集上的指标如下: 音色 词错误率 WER (↓) 音色相似度 SIM (↑) zh en hard zh en hard Chelsie 1.256 2.004 6.171 0.658 0.473 0.662 Serena 1....