🎙️ Edge TTS 文本转语音 - 功能说明
一、核心功能
| 功能 | 说明 |
|---|---|
| 文本转语音 | 使用微软 Edge TTS 引擎,将输入文本转换为自然流畅的 MP3 音频 |
| 长文本支持 | 自动分段处理(每段 ≤800 字符),支持超长文本合成 |
| 音频合并 | 自动将分段音频合并为单一文件输出 |
| 多国语言 | 支持中文、英语、日语、韩语、法语、德语等数十种语言 |
二、语音选择系统
两级联动选择:
- 选择国家/地区 - 带国旗标识,如 🇨🇳 中文(中国)、🇺🇸 英语(美国)、🇯🇵 日语
- 选择具体语音 - 显示该地区的可用语音及性别,如 Xiaoxiao (Female)、Yunyang (Male)
智能排序: 中文优先显示,其他语言按常用程度排列
三、音频参数调节
四、文件管理
- 输出目录: output/ 文件夹
- 命名格式: 日期_随机数.mp3(如 20260331_143022_a1b2c3.mp3)
- 自动清理: 合并完成后自动删除临时分段文件
五、稳定性保障
- 重试机制: 单段合成失败自动重试 5 次
- 错误处理: 某段失败时自动清理已生成的临时文件
- 依赖检查: 自动检测 pydub,未安装时给出友好提示
六、界面特性
- 简洁的 Gradio 网页界面
- 实时错误提示显示
- 音频播放控件(生成后可直接试听)
- 底部显示项目来源链接(剑二十七二次开发)
七、典型使用场景
- 短视频配音 - 快速生成中文或外文解说音频
- 有声读物 - 将长篇文章转为语音朗读
- 多语言内容 - 一键切换生成不同国家语言的语音
- 语音调试 - 调节语速音调,找到最佳朗读效果
技术基础: 基于微软 Edge TTS 在线服务,无需本地模型,即开即用。


工具说明
1 解压即可使用,无需安装任何东西
2 调用的是微软的 Edge TTS 免费 无限制
3 人气高就继续开发