EADST

IndexTTS2 环境说明与依赖分析(Linux / Conda py310)

本文主要介绍 IndexTTS2 在 Linux 环境中的依赖情况,并展示当前环境的 Python 版本、CUDA 版本以及完整的 pip 包列表,方便后续部署、迁移或问题排查。


一、环境基础信息

本环境基于 Conda 创建的 Python 3.10 环境(名称:py310),主要用于运行 IndexTTS2 及其相关生态工具。

Python 版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ python
Python 3.10.19 (main, Oct 21 2025, 16:43:05) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()

该环境使用 Python 3.10.19,属于较新的 3.10 系列,兼容 Transformers / PyTorch / IndexTTS2 相关的主流依赖。


二、CUDA 信息

IndexTTS2 依赖 GPU 加速,环境中安装了 CUDA 11.7 的编译工具链。

CUDA 编译器版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

PyTorch 版本与 CUDA 绑定

pip 包信息显示:

  • torch==2.4.0+cu118
  • torchaudio==2.4.0+cu118

说明 PyTorch 使用 CUDA 11.8 的预编译版本,并且与系统的 CUDA 11.7 工具链兼容。


三、IndexTTS2 相关依赖组成

IndexTTS2 使用的大部分依赖来自 NLP、语音处理、生成式模型等常用生态。 以下为核心依赖分类介绍,便于理解环境构成。


1. 语音处理类库

这些库用于音频读取、特征提取、声码器推理等:

  • librosa
  • soundfile
  • soxr
  • pydub
  • audioread
  • ffmpeg-python, ffmpy

这些工具帮助完成音频预处理、采样率转换、特征计算,是 IndexTTS2 的关键组件。


2. 模型推理与深度学习框架

  • torch==2.4.0+cu118
  • triton
  • transformers==4.52.1
  • accelerate

IndexTTS2 的大模型部分(声学模型、后处理模型)依赖上述框架进行推理与加速优化。


3. 文本处理相关依赖

包括分词、G2P(字音转换)、语言处理:

  • jieba
  • g2p-en
  • pynini
  • sentencepiece
  • cn2an
  • textstat

这些依赖对中英文文本前处理、文本规范化(TN)非常重要。


4. HuggingFace 全家桶

  • huggingface-hub
  • hf_transfer
  • hf-xet
  • accelerate
  • transformers

用于加载 IndexTTS2 需要的 pretrained 模型权重。


5. Web 服务相关依赖(适合部署 API)

IndexTTS2 可作为服务部署,因此需要:

  • fastapi
  • uvicorn
  • starlette
  • Flask
  • pydantic

便于构建 RESTful API 和 WebUI。


6. 前端 / UI 依赖

如果使用 Gradio 部署可视化页面:

  • gradio
  • gradio_client

四、完整 pip 包列表

以下为环境中完整的 pip 包内容,用于备份、比对或迁移(如 Docker 镜像制作)。

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ pip list
Package                  Version      Build
------------------------ ------------ -----
absl-py                  2.3.1
accelerate               1.8.1
aiofiles                 24.1.0
annotated-doc            0.0.4
annotated-types          0.7.0
antlr4-python3-runtime   4.9.3
anyio                    4.12.0
argbind                  0.3.9
asttokens                3.0.1
audioread                3.1.0
bce-python-sdk           0.9.54
blinker                  1.9.0
brotli                   1.2.0
cachetools               6.2.2
certifi                  2025.11.12
cffi                     2.0.0
charset-normalizer       3.4.4
click                    8.3.1
cn2an                    0.5.22
contourpy                1.3.2
cycler                   0.12.1
Cython                   3.0.7
decorator                5.2.1
descript-audiotools      0.7.2
Distance                 0.1.3
docstring_parser         0.17.0
einops                   0.8.1
exceptiongroup           1.3.1
executing                2.2.1
fastapi                  0.122.0
ffmpeg-python            0.2.0
ffmpy                    1.0.0
filelock                 3.20.0
fire                     0.7.1
Flask                    3.1.2
flatten-dict             0.4.2
fonttools                4.61.0
fsspec                   2025.10.0
future                   1.0.0
g2p-en                   2.1.0
google-auth              2.43.0
google-auth-oauthlib     0.4.6
gradio                   6.0.1
gradio_client            2.0.0
groovy                   0.1.2
grpcio                   1.76.0
h11                      0.16.0
hf_transfer              0.1.9
hf-xet                   1.2.0
httpcore                 1.0.9
httpx                    0.28.1
huggingface-hub          0.34.0
idna                     3.11
importlib_resources      6.5.2
inflect                  7.5.0
inquirerpy               0.3.4
ipython                  8.37.0
itsdangerous             2.2.0
jedi                     0.19.2
jieba                    0.42.1
Jinja2                   3.1.6
joblib                   1.5.2
json5                    0.10.0
julius                   0.2.7
keras                    2.9.0
kiwisolver               1.4.9
lazy_loader              0.4
librosa                  0.10.2.post1
llvmlite                 0.41.1
Markdown                 3.10
markdown-it-py           4.0.0
markdown2                2.5.4
MarkupSafe               3.0.3
matplotlib               3.8.2
matplotlib-inline        0.2.1
mdurl                    0.1.2
modelscope               1.27.0
more-itertools           10.8.0
mpmath                   1.3.0
msgpack                  1.1.2
munch                    4.0.0
networkx                 3.4.2
nltk                     3.9.2
numba                    0.58.1
numpy                    1.26.2
nvidia-cublas-cu11       11.11.3.6
nvidia-cuda-cupti-cu11   11.8.87
nvidia-cuda-nvrtc-cu11   11.8.89
nvidia-cuda-runtime-cu11 11.8.89
nvidia-cudnn-cu11        9.1.0.70
nvidia-cufft-cu11        10.9.0.58
nvidia-curand-cu11       10.3.0.86
nvidia-cusolver-cu11     11.4.1.48
nvidia-cusparse-cu11     11.7.5.86
nvidia-nccl-cu11         2.20.5
nvidia-nvtx-cu11         11.8.86
oauthlib                 3.3.1
omegaconf                2.3.0
opencv-python            4.9.0.80
orjson                   3.11.4
packaging                25.0
pandas                   2.3.2
parso                    0.8.5
pexpect                  4.9.0
pfzy                     0.3.4
pillow                   12.0.0
pip                      25.3
platformdirs             4.5.0
pooch                    1.8.2
proces                   0.1.7
prompt_toolkit           3.0.52
protobuf                 3.19.6
psutil                   7.1.3
ptyprocess               0.7.0
pure_eval                0.2.3
pyasn1                   0.6.1
pyasn1_modules           0.4.2
pycparser                2.23
pycryptodome             3.23.0
pydantic                 2.12.4
pydantic_core            2.41.5
pydub                    0.25.1
Pygments                 2.19.2
pyloudnorm               0.1.1
pynini                   2.1.5
pyparsing                3.2.5
pyphen                   0.17.2
pystoi                   0.4.1
python-dateutil          2.9.0.post0
python-multipart         0.0.20
pytz                     2025.2
PyYAML                   6.0.3
randomname               0.2.1
regex                    2025.11.3
requests                 2.32.5
requests-oauthlib        2.0.0
rich                     14.2.0
rsa                      4.9.1
safehttpx                0.1.7
safetensors              0.5.2
scikit-learn             1.7.2
scipy                    1.15.3
semantic-version         2.10.0
sentencepiece            0.2.1
setuptools               80.9.0
shellingham              1.5.4
six                      1.17.0
soundfile                0.13.1
soxr                     1.0.0
stack-data               0.6.3
starlette                0.50.0
sympy                    1.14.0
tensorboard              2.9.1
tensorboard-data-server  0.6.1
tensorboard-plugin-wit   1.8.1
termcolor                3.2.0
textstat                 0.7.11
threadpoolctl            3.6.0
tokenizers               0.21.0
tomlkit                  0.13.3
torch                    2.4.0+cu118
torch-stoi               0.2.3
torchaudio               2.4.0+cu118
tqdm                     4.67.1
traitlets                5.14.3
transformers             4.52.1
triton                   3.0.0        1
typeguard                4.4.4
typer                    0.20.0
typer-slim               0.20.0
typing_extensions        4.15.0
typing-inspection        0.4.2
tzdata                   2025.2
urllib3                  2.5.0
uvicorn                  0.38.0
wcwidth                  0.2.14
Werkzeug                 3.1.3
WeTextProcessing         1.0.3
wheel                    0.45.1

五、总结

本篇博客介绍了 IndexTTS2 在 py310 Conda 环境中的:

  • Python 基础环境
  • CUDA 加速环境
  • 完整的依赖组件分类
  • pip 包完整清单

该环境可直接作为 IndexTTS2 的运行环境基准,用于部署、测试或迁移。

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
Qwen BeautifulSoup OpenCV Michelin RGB VPN SQL TensorFlow 证件照 Baidu Attention Domain Hotel Bipartite 多进程 GoogLeNet Quantization 递归学习法 CTC 阿里云 CUDA CV XML Llama Algorithm XGBoost v0.dev Website 签证 报税 Disk Ubuntu git-lfs ModelScope Vim Qwen2 JSON FP8 Jetson Django MD5 Data Bin tar ChatGPT PIP Excel GPTQ TSV Password WAN 继承 QWEN YOLO Distillation Input Pillow Template CAM logger TensorRT Zip 算法题 Git Python Anaconda Claude v2ray LLM NLP Qwen2.5 音频 Search Use printf Miniforge Markdown FP64 RAR LoRA uwsgi FP16 Heatmap InvalidArgumentError SQLite 净利润 Paper Datetime DeepSeek Dataset Jupyter 图形思考法 hf CEIR IndexTTS2 Random Base64 TTS CLAP Docker CSV WebCrawler LLAMA Numpy 强化学习 Statistics git Video Nginx 腾讯云 Animate Translation 域名 Google VGG-16 Tiktoken Proxy Github Interview PyCharm Breakpoint OpenAI Freesound 版权 mmap Pytorch Gemma Review Shortcut Firewall GPT4 torchinfo Crawler COCO Paddle 第一性原理 SAM tqdm News Plate SVR icon Bitcoin Hungarian 顶会 搞笑 Ptyhon Card BF16 Tracking Logo PyTorch FastAPI 关于博主 ONNX BTC FP32 Knowledge PDF HuggingFace FlashAttention 云服务器 Image2Text scipy Web Linux Diagram EXCEL C++ SPIE Sklearn Plotly Bert NameSilo AI ResNet-50 Land UI Conda CC uWSGI Food OCR HaggingFace PDB Streamlit Permission Color Tensor 多线程 LaTeX Math Augmentation 财报 图标 NLTK llama.cpp Clash GGML Magnet VSCode LeetCode GIT Mixtral 飞书 Windows transformers 公式 Vmess Transformers Rebuttal UNIX Safetensors Pandas Cloudreve Hilton Agent Quantize DeepStream Pickle diffusers API
站点统计

本站现有博文323篇,共被浏览795419

本站已经建立2493天!

热门文章
文章归档
回到顶部