MOSS-TTS-v1.5+MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行,一个高质量的开源中文文本到语音合成系统 一键整合包 v20260604 支持免费商业使用 支持暂停

AI 18 8429

🎙️ MOSS-TTS:让文字拥有“千人千面”的超级嗓音

一句话看懂:这是一个由复旦大学和模思智能联合开发的开源人工智能项目。它的核心本领就是把文字变成极其逼真、带有感情的真人声音

✨ 为什么它比传统的“机器朗读”更厉害?

传统的配音软件听起来往往像没有感情的机器人,而 MOSS-TTS 拥有以下 5 大“超能力”:

1. 🎭 神奇的“声音克隆”魔术

只需要听一段大约 3 秒的录音,它就能完美“偷师”这个人的音色和说话习惯。哪怕是它没见过的新文字,也能用这个人的声音原汁原味地读出来,逼真到难辨真假。

2. 📖 读长篇巨著“不喘气、不变调”

很多 AI 读短文还行,一读几万字就变调或卡壳。MOSS-TTS 专门攻克了长文本难题,能一口气极其稳定地读完超长文章,无需人工切分,简直是批量制作“有声书”的神器。

3. 🌍 丝滑的“中英双语”无缝切换

它是个精通双语的专业主播。如果一句话里既有中文又有英文,它能极其自然地来回切换,完全不会有传统机器那种生硬的“外国口音”或突兀的停顿。

4. 🎬 像导演一样“精准控制”语气

你可以像导演给演员说戏一样控制它。通过细粒度的指令,你能精确指定它在哪里停顿、停顿几秒,甚至控制拼音和发音细节,让朗读的节奏完美契合你的情感需求。

5. ⚡ 反应极快,适合“实时对话”

它支持“流式输出”——你这边文字还没输完,它那边就已经开始出声了。这种极低的延迟让它能完美充当 AI 语音助手的“嘴巴”,让对话像真人聊天一样流畅,告别“说完话等半天”的尴尬。

📦 量身定制的“模型家族”

MOSS-TTS 并不是单一的工具,而是一个包含三位成员的“家族”,以适应不同的使用场景:
成员名称
特点与优势
最适合谁用?
🚀旗舰版

(MOSS-TTS)
功能最全、音质最高。细节拉满,表现力极强。
专业有声书制作、高质量视频配音、大规模旁白生成。
🪶超轻量版

(MOSS-TTS-Nano)
体积小巧、不吃配置。仅需 1 亿参数,普通电脑 CPU 就能流畅运行,无需昂贵独立显卡。
个人开发者、硬件配置不高的设备、轻量级应用。
🗣️实时版

(MOSS-TTS-Realtime)
专为对话而生。结合上下文语境,让语音交互连贯自然。
开发实时语音助手、AI 智能客服、虚拟人对话系统。

💡 总结一下

如果把文字比作剧本,MOSS-TTS 就是那个不需要休息、不需要片酬、还能随时模仿任何人声线的“超级配音演员”
无论是想做逼真的声音克隆、录制长篇有声小说,还是开发一个能秒回话的 AI 语音助手,它都能提供接近真人水平的完美支持。

下面是1.5的截图

我随手生成的语音 你们听下

整合包说明:

1 自行安装好cuda,安装你显卡能支持的cuda最高版本就好了

2 支持50系。

3 未修改任何代码,保持原汁原味

4 生成的语音效果确实不错

5 10G英伟达显卡就可以运行了。

6 解压失败的话 用winrar管理员身份解压。

20251104 更新记录

1 更新到官方的最新代码

2 把模型从0.5升级到了0.7

3 修正部分小bug

20260421 更新记录

1 新增 MOSS-TTS-Nano模型

2 这个模型非常轻量,CPU也可以运行

3 生成的语音效果非常不错

20260604 更新记录

1 升级到MOSS-TTS-v1.5,这个模型是8b的,最低要求16G显卡,24G内存

2 增加自动保存到output

3 增加暂停时间按钮

4 人气就继续开发

点击查看

下载地址
夸克网盘

下载有疑问看下这里


相关推荐:

我要评论:

◎欢迎参与讨论,请自觉遵守国家法律法规。

已有 18 条评论

  1. 棉花糖寒冷 棉花糖寒冷

    原来如此,谢谢指点!

  2. 棉花糖寒冷 棉花糖寒冷

    大神,我用的是20260421 版本,没有您文章中截图的对话语音生成页面,只有一个声音克隆的页面......

    1. 剑心 剑心

      截图是以前版本的截图

  3. 剑心 剑心

    我没明白你的意思是?

  4. 棉花糖寒冷 棉花糖寒冷

    大神,效果是真好!只是,打开就只有一个页面:声音克隆。不知怎么回事......期待回复指点,谢谢!

  5. 彩色闻鲜花 彩色闻鲜花

    大神要不要更新一下啊,这个软件的模型升级到V.10了

    1. 剑心 剑心

      没什么人气,更新动力不强

  6. 外套温婉 外套温婉

    显示类似00007FF9F56A742200007FF9F56A7340 python312.d11!Pyethod Self 【umknown file>@ 这样的,然后就不运行了,是啥原因啊?python啥的也装了最新版的了!

    1. 剑心 剑心

      你本机的python 和 我的整合包有冲突,本机不要安装python

      1. 外套温婉 外套温婉

        就是把pyhon删除掉是吗?

        1. 剑心 剑心

          是的

          1. 外套温婉 外套温婉

            解压搞定了然后还是这样:00007FFCA92618D400007FFCA9260A30 torch_python.dll!c10::ivalue::Future::devices [ @ ]
            00007FFDF572142D00007FFDF57206D0 python310.dll!PyCFunction_GetFlags [ @ ]00007FFDF56DC57700007FFDF56DC480 python310.dll!PyObject_Call [ @ ]00007FFDF57F112C00007FFDF57F0A70 pytho
            是不是我没删除干净啊?咋样整一下!求!!!!!!!!

          2. 外套温婉 外套温婉

            大佬又出状况了,解压的时候MOSS-TTSD20250708.rar\jian27\Scripts文件夹里面的pip3.exe解压错误!

            1. 剑心 剑心

              仔细看文章内容。你花了那么多时间去瞎折腾 为什么不花2分钟看看文章内容呢?

  7. 亦然 亦然

    这个需要科学上网吗,请看:
    File "D:\BOOK\Qwen-TTS\Qwen-TTS-20250715\jian27\lib\site-packages\gradio\utils.py", line 940, in wrapper
    response = f(*args, **kwargs)
    File "", line 202, in generate_tts
    File "", line 116, in tts_gradio
    gradio.exceptions.Error: "处理过程中出错: 'NoneType' object has no attribute 'audio'"

    1. 剑心 剑心

      不要科学上网

  8. 剑心 剑心

    在操作什么出现这个错误?

  9. 闪闪扯未来 闪闪扯未来

    Error: Audio generation failed: Expecting value: line 1 column 1 (char 0)

    Details:
    Traceback (most recent call last):
    File "", line 208, in process_single_audio_generation
    File "", line 172, in initialize_model
    File "J:\AI\MOSS-TTSD20250708\generation_utils.py", line 16, in load_model
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    File "J:\AI\MOSS-TTSD20250708\jian27\lib\site-packages\transformers\models\auto\tokenization_auto.py", line 982, in from_pr

只显示最新的15条留言