什么是TTS?
TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。
IndexTTS2是由哔哩哔哩(B 站)Index 团队开源的文本转语音(TTS)模型,v2版是IndexTTS1.5的升级迭代版本。
IndexTTS2特性
✅ 角色扮演(支持2个角色对话)
✅ 支持声音克隆;
✅ 情绪控制,包括音色情绪与文本情绪控制。
硬件需求
v1版≥4G显存。
v1.5版≥6-8G显存。
v2.0版≥10-12G显存
安装Index-TTS节点
第1步:安装节点
方式一:管理器(Maganer)安装
通过管理器搜索IndexTTS,点击Install进行安装,如图所示:
方式二:git clone安装
克隆节点:
git clone https://github.com/billwuhao/ComfyUI_IndexTTS
安装依赖:
pip install -r requirements.txt
第2步:安装必要轮子
对于该节点必须安装的轮子有triton和pynini,可参考轮子安装教程。传送门:comfyui常用轮子大全-whl文件下载安装
安装完成后还应运行以下命令:
pip install importlib_resources
pip install WeTextProcessing>=1.0.4 --no-deps
第3步:下载模型
网盘下载:https://pan.quark.cn/s/c6a1f4d56de9
存放目录:ComfyUI/models/TTS
更多渠道下载 ⬇ ⬇ ⬇
报错问题解决
确保上述安装过程都顺利进行的情况下,比较常见的报错有以下几种:
# 报错1
import name 'QuantizedCacheConfig' from 'transformers.cache_utils'
# 报错2
'NoneType' object has no attribute 'index_select'
# 报错3
ModuleNotFoundError: No module named 'tn'
解决方案:
下载整合包
解压到不含中文和特殊符号的目录中,直接运行启动comfyui.bat,无需安装与配置环境,已解决nunchaku无法兼容这一问题。整合包内不含任何模型,可根据需要自行下载,也可以使用extra_model_paths.yaml文件配置模型共享。还不知道如何配置模型共享,可以参考之前的教程。传送门:认清comfyui结构,掌握版本切换、启动参数
下载地址:https://pan.quark.cn/s/d3227f8ab352
环境版本
Python version: 3.12
pytorch version: 2.7.0+cu128
xformers version: 0.0.30
ComfyUI version: 0.3.60
ComfyUI frontend version: 1.26.13
Nunchaku version: 1.0.1
已安装的节点
ComfyUI_IndexTTS(文本转语音)
ComfyUI-DD-Translation(节点汉化)
comfyui_controlnet_aux(controlnet预处理器)
comfyui_segment_anything(遮罩处理)
ComfyUI_UltimateSDUpscale(图像分块放大)
comfyui-brushnet(SD1.5/SDXL局部重绘)
ComfyUI-GGUF(GGUF模型加载器)
ComfyUI-nunchaku(双截棍加速)
如何使用IndexTTS
IndexTTSv1-1.5工作流
第一步:添加IndexTTS Run节点
将IndexTTS Run节点添加到工作流中,该节点位于:节点库→MW→MW-IndexTTS Run节点。如图所示:
双人对话
双人对话需增加一个加载音频节点,用于加载第2个角色参考音频,并与dialogue_audio_s2输入相连。
文本中需要使用[S1] 表示第1个语音角色, [S2] 表示第2个语音角色。如下所示:
[S1]悟空,我们此去西天,路途遥远,需历经九九八十一难……
[S2]师傅,西天路远,GDP增长点不明!不如先取荆州在取经。取荆州,是战略!是生态!是流量入口!有了荆州,西天直播带货,香火钱翻倍!”
[S1]阿弥陀佛,有道理啊。那我们改道,先去取荆州。
......
完整工作流,如图所示:
节点详细参数说明
IndexTTS2工作流
indexTTS2与v1版非常相似,仅需一些简单的小改的即可。
更换IndexTTS2 Run节点
这里不在使用IndexTTS Run节点,而是将其更换为IndexTTS2 Run节点,该节点同样位于:节点库→MW→MW-IndexTTS2 Run节点。如图所示:
使用提示词(pormpt)作为情绪控制
除了使用音频作为情绪参考,还可以使用pormpt文本来控制情绪。
IndexTTS2 Run节点参数详细说明






评论(0)