浅谈IndexTTS的部署

什么是IndexTTS2?

IndexTTS2是一个文字转语音模型，类似于我们树脂的RVC，但目前看合成的样本好于RVC，它可以紧提供一个三秒左右的音频样本即可生成已假论真的声音效果，你也可以自定义它所需要的语速、语音、情绪、停顿等，下面我们来看看官方的介绍：

啰嗦的一堆如何部署呢？有人说了，不是有一件整合包吗，为什么还要这么麻烦的部署？

确实，网上已经有很方便的整合包，但如果你爱折腾，喜欢玩，不妨也跟着我尝试一下自己部署它，如果你自己把它亲自动手让它跑起来，是不是有一些成就感？

请确保已安装 git 和 git-lfs。

如果你在windows上已经装了git，那么你就不用在特意去装git-lfs了。

在仓库中启用Git-LFS：

git lfs install

安装uv和modelscope,uv是一个非常快的Python包和项目管理器，官方号称比pip快115倍。modelscope是从(https://modelscope.cn)上下载所需模型用的。

pip install uv modelscope

git clone https://github.com/index-tts/index-tts.git && cd index-tts

uv sync --all-extras

如果下载速度缓慢可以使用国内的镜像：

uv sync --all-extras --default-index "https://mirrors.aliyun.com/pypi/simple"

uv sync --all-extras --default-index "https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"

如果安装DeepSpeed报错可以去除--all-extras。及变成了

uv sync

如使用镜像，复制上面带镜像的地址自行去除--all-extras。

如果遇到cuda报错，要注意，请确保已安装NVIDIA CUDA Toolkit 12.8及以上。

modelscope download --model IndexTeam/IndexTTS-2 --local_dir checkpoints

耐心等待，慢慢下载。

至此，部署完成！

uv run webui.py

首次运行可能会很慢，仍需要下载一些东西，耐心等待。

当然以后开起来也不会很快，我电脑不是很新，需要开一分钟,当命令行看到

的时候，就表示已经运行起来了，你可以在浏览器访问(http://127.0.0.1:7860)打开web界面。

可通过命令行参数开启FP16推理（降低显存占用）、DeepSpeed加速、CUDA内核编译加速等。可运行以下命令查看所有选项：

uv run webui.py -h

本文章为个人整理，方便以后自行部署，部分文字参考官方说明，如有侵权可联系删除。