MOSS-TTS-v1.5+MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行，一个高质量的开源中文文本到语音合成系统一键整合包 v20260604 支持免费商业使用支持暂停

2026-06-04 昨天 08:38 AI 8429

🎙️ MOSS-TTS：让文字拥有“千人千面”的超级嗓音

一句话看懂：这是一个由复旦大学和模思智能联合开发的开源人工智能项目。它的核心本领就是把文字变成极其逼真、带有感情的真人声音。

✨ 为什么它比传统的“机器朗读”更厉害？

传统的配音软件听起来往往像没有感情的机器人，而 MOSS-TTS 拥有以下 5 大“超能力”：

1. 🎭 神奇的“声音克隆”魔术

只需要听一段大约 3 秒的录音，它就能完美“偷师”这个人的音色和说话习惯。哪怕是它没见过的新文字，也能用这个人的声音原汁原味地读出来，逼真到难辨真假。

2. 📖 读长篇巨著“不喘气、不变调”

很多 AI 读短文还行，一读几万字就变调或卡壳。MOSS-TTS 专门攻克了长文本难题，能一口气极其稳定地读完超长文章，无需人工切分，简直是批量制作“有声书”的神器。

3. 🌍 丝滑的“中英双语”无缝切换

它是个精通双语的专业主播。如果一句话里既有中文又有英文，它能极其自然地来回切换，完全不会有传统机器那种生硬的“外国口音”或突兀的停顿。

4. 🎬 像导演一样“精准控制”语气

你可以像导演给演员说戏一样控制它。通过细粒度的指令，你能精确指定它在哪里停顿、停顿几秒，甚至控制拼音和发音细节，让朗读的节奏完美契合你的情感需求。

5. ⚡ 反应极快，适合“实时对话”

它支持“流式输出”——你这边文字还没输完，它那边就已经开始出声了。这种极低的延迟让它能完美充当 AI 语音助手的“嘴巴”，让对话像真人聊天一样流畅，告别“说完话等半天”的尴尬。

📦 量身定制的“模型家族”

MOSS-TTS 并不是单一的工具，而是一个包含三位成员的“家族”，以适应不同的使用场景：

成员名称	特点与优势	最适合谁用？
🚀旗舰版 (MOSS-TTS)	功能最全、音质最高。细节拉满，表现力极强。	专业有声书制作、高质量视频配音、大规模旁白生成。
🪶超轻量版 (MOSS-TTS-Nano)	体积小巧、不吃配置。仅需 1 亿参数，普通电脑 CPU 就能流畅运行，无需昂贵独立显卡。	个人开发者、硬件配置不高的设备、轻量级应用。
🗣️实时版 (MOSS-TTS-Realtime)	专为对话而生。结合上下文语境，让语音交互连贯自然。	开发实时语音助手、AI 智能客服、虚拟人对话系统。

💡 总结一下

如果把文字比作剧本，MOSS-TTS 就是那个不需要休息、不需要片酬、还能随时模仿任何人声线的“超级配音演员”。

无论是想做逼真的声音克隆、录制长篇有声小说，还是开发一个能秒回话的 AI 语音助手，它都能提供接近真人水平的完美支持。

下面是1.5的截图

我随手生成的语音你们听下

整合包说明：

1 自行安装好cuda，安装你显卡能支持的cuda最高版本就好了

2 支持50系。

3 未修改任何代码，保持原汁原味

4 生成的语音效果确实不错

5 10G英伟达显卡就可以运行了。

6 解压失败的话用winrar管理员身份解压。

20251104 更新记录

1 更新到官方的最新代码

2 把模型从0.5升级到了0.7

3 修正部分小bug

20260421 更新记录

1 新增 MOSS-TTS-Nano模型

2 这个模型非常轻量，CPU也可以运行

3 生成的语音效果非常不错

20260604 更新记录

1 升级到MOSS-TTS-v1.5，这个模型是8b的，最低要求16G显卡，24G内存

2 增加自动保存到output

3 增加暂停时间按钮

4 人气就继续开发

点击查看

下载地址

夸克网盘

下载有疑问看下这里

工具日常应用绿色软件音频音频处理开源人工智能 AI 大模型效率工具整合包 Tag

给你配了个“AI配音导演”：阿里这款新模型，能直接给电影配音了！ Fun-CineForge 一键整合包 v20260603 解压即可使用

神器开源视频音频处理神器 FFmpeg 官网最新版附安装教程 v2026-06-01

我要评论：

◎欢迎参与讨论，请自觉遵守国家法律法规。

已有 18 条评论

棉花糖寒冷

2026-04-25

原来如此，谢谢指点！

回复
棉花糖寒冷

2026-04-24

大神，我用的是20260421 版本，没有您文章中截图的对话语音生成页面，只有一个声音克隆的页面......

回复
1. 剑心
  
  2026-04-24
  
  截图是以前版本的截图
  
  回复
剑心

2026-04-23

我没明白你的意思是？

回复
棉花糖寒冷

2026-04-23

大神，效果是真好！只是，打开就只有一个页面：声音克隆。不知怎么回事......期待回复指点，谢谢！

回复
彩色闻鲜花

2026-03-19

大神要不要更新一下啊，这个软件的模型升级到V.10了

回复
1. 剑心
  
  2026-03-19
  
  没什么人气，更新动力不强
  
  回复
外套温婉

2025-07-20

显示类似00007FF9F56A742200007FF9F56A7340 python312.d11!Pyethod Self 【umknown file>@ 这样的,然后就不运行了，是啥原因啊？python啥的也装了最新版的了！

回复
1. 剑心
  
  2025-07-20
  
  你本机的python 和我的整合包有冲突，本机不要安装python
  
  回复
  1. 外套温婉
    
    2025-07-20
    
    就是把pyhon删除掉是吗？
    
    回复
    
    剑心
    
    2025-07-20
    
    是的
    
    回复
    
    外套温婉
    
    2025-07-20
    
    解压搞定了然后还是这样：00007FFCA92618D400007FFCA9260A30 torch_python.dll!c10::ivalue::Future::devices [ @ ]
    00007FFDF572142D00007FFDF57206D0 python310.dll!PyCFunction_GetFlags [ @ ]00007FFDF56DC57700007FFDF56DC480 python310.dll!PyObject_Call [ @ ]00007FFDF57F112C00007FFDF57F0A70 pytho
    是不是我没删除干净啊？咋样整一下！求！！！！！！！！
    
    回复
    
    外套温婉
    
    2025-07-20
    
    大佬又出状况了，解压的时候MOSS-TTSD20250708.rar\jian27\Scripts文件夹里面的pip3.exe解压错误！
    
    回复
    
    剑心
    
    2025-07-20
    
    仔细看文章内容。你花了那么多时间去瞎折腾为什么不花2分钟看看文章内容呢？
    
    回复
亦然

2025-07-18

这个需要科学上网吗，请看：
File "D:\BOOK\Qwen-TTS\Qwen-TTS-20250715\jian27\lib\site-packages\gradio\utils.py", line 940, in wrapper
response = f(*args, **kwargs)
File "", line 202, in generate_tts
File "", line 116, in tts_gradio
gradio.exceptions.Error: "处理过程中出错: 'NoneType' object has no attribute 'audio'"

回复
1. 剑心
  
  2025-07-18
  
  不要科学上网
  
  回复
剑心

2025-07-12

在操作什么出现这个错误？

回复
闪闪扯未来

2025-07-11

Error: Audio generation failed: Expecting value: line 1 column 1 (char 0)
Details:
Traceback (most recent call last):
File "", line 208, in process_single_audio_generation
File "", line 172, in initialize_model
File "J:\AI\MOSS-TTSD20250708\generation_utils.py", line 16, in load_model
tokenizer = AutoTokenizer.from_pretrained(model_path)
File "J:\AI\MOSS-TTSD20250708\jian27\lib\site-packages\transformers\models\auto\tokenization_auto.py", line 982, in from_pr

回复