什么是TTS?

TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。

IndexTTS2是由哔哩哔哩(B 站)Index 团队开源的文本转语音(TTS)模型,v2版是IndexTTS1.5的升级迭代版本。

IndexTTS2特性

✅ 角色扮演(支持2个角色对话)

✅ 支持声音克隆;

✅ 情绪控制,包括音色情绪与文本情绪控制。

 

硬件需求

v1版≥4G显存。

v1.5版≥6-8G显存。

v2.0版≥10-12G显存

 

安装Index-TTS节点

第1步:安装节点

方式一:管理器(Maganer)安装

通过管理器搜索IndexTTS,点击Install进行安装,如图所示:

manager安装IndexTTS

 

方式二:git clone安装

克隆节点:

git clone https://github.com/billwuhao/ComfyUI_IndexTTS

安装依赖:

pip install -r requirements.txt

 

第2步:安装必要轮子

对于该节点必须安装的轮子有tritonpynini,可参考轮子安装教程。传送门:comfyui常用轮子大全-whl文件下载安装

安装完成后还应运行以下命令:

pip install importlib_resources
pip install WeTextProcessing>=1.0.4 --no-deps

 

第3步:下载模型

网盘下载:https://pan.quark.cn/s/c6a1f4d56de9

存放目录:ComfyUI/models/TTS

更多渠道下载 ⬇ ⬇ ⬇

隐藏内容
此内容需解锁查看
未解锁内容包含:约2347个字符
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

 

报错问题解决

确保上述安装过程都顺利进行的情况下,比较常见的报错有以下几种:

# 报错1
import name 'QuantizedCacheConfig' from 'transformers.cache_utils'

# 报错2
'NoneType' object has no attribute 'index_select'

# 报错3
ModuleNotFoundError: No module named 'tn'

 

解决方案:

隐藏内容
此内容需解锁查看
未解锁内容包含:约460个字符,和1张图像
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

 

下载整合包

解压到不含中文和特殊符号的目录中,直接运行启动comfyui.bat,无需安装与配置环境,已解决nunchaku无法兼容这一问题。整合包内不含任何模型,可根据需要自行下载,也可以使用extra_model_paths.yaml文件配置模型共享。还不知道如何配置模型共享,可以参考之前的教程。传送门:认清comfyui结构,掌握版本切换、启动参数

下载地址:https://pan.quark.cn/s/d3227f8ab352

环境版本

Python version: 3.12

pytorch version: 2.7.0+cu128
xformers version: 0.0.30

ComfyUI version: 0.3.60
ComfyUI frontend version: 1.26.13

Nunchaku version: 1.0.1

 

已安装的节点

ComfyUI_IndexTTS(文本转语音)
ComfyUI-DD-Translation(节点汉化)
comfyui_controlnet_aux(controlnet预处理器)
comfyui_segment_anything(遮罩处理)
ComfyUI_UltimateSDUpscale(图像分块放大)
comfyui-brushnet(SD1.5/SDXL局部重绘)
ComfyUI-GGUF(GGUF模型加载器)
ComfyUI-nunchaku(双截棍加速)

 

如何使用IndexTTS

IndexTTSv1-1.5工作流

第一步:添加IndexTTS Run节点

将IndexTTS Run节点添加到工作流中,该节点位于:节点库→MW→MW-IndexTTS Run节点。如图所示:

IndexTTS Run节点位置

隐藏内容
此内容需解锁查看
未解锁内容包含:约531个字符,和3张图像
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

双人对话

双人对话需增加一个加载音频节点,用于加载第2个角色参考音频,并与dialogue_audio_s2输入相连。

文本中需要使用[S1] 表示第1个语音角色, [S2] 表示第2个语音角色。如下所示:

[S1]悟空,我们此去西天,路途遥远,需历经九九八十一难……
[S2]师傅,西天路远,GDP增长点不明!不如先取荆州在取经。取荆州,是战略!是生态!是流量入口!有了荆州,西天直播带货,香火钱翻倍!”
[S1]阿弥陀佛,有道理啊。那我们改道,先去取荆州。
......

 

完整工作流,如图所示:

IndexTTS双人对话完整工作流

 

节点详细参数说明

隐藏内容
此内容需解锁查看
未解锁内容包含:约962个字符
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

IndexTTS2工作流

indexTTS2与v1版非常相似,仅需一些简单的小改的即可。

更换IndexTTS2 Run节点

这里不在使用IndexTTS Run节点,而是将其更换为IndexTTS2 Run节点,该节点同样位于:节点库→MW→MW-IndexTTS2 Run节点。如图所示:

隐藏内容
此内容需解锁查看
未解锁内容包含:约180个字符,和3张图像
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

使用提示词(pormpt)作为情绪控制

除了使用音频作为情绪参考,还可以使用pormpt文本来控制情绪。

IndexTTS2 Run节点参数详细说明

隐藏内容
此内容需解锁查看
未解锁内容包含:约635个字符
  • 普通用户: 5.9牛币
  • VIP: 免费
  • SVIP: 免费
已有104人赞助并解锁

 

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。