EADST

IndexTTS2 环境说明与依赖分析(Linux / Conda py310)

本文主要介绍 IndexTTS2 在 Linux 环境中的依赖情况,并展示当前环境的 Python 版本、CUDA 版本以及完整的 pip 包列表,方便后续部署、迁移或问题排查。


一、环境基础信息

本环境基于 Conda 创建的 Python 3.10 环境(名称:py310),主要用于运行 IndexTTS2 及其相关生态工具。

Python 版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ python
Python 3.10.19 (main, Oct 21 2025, 16:43:05) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()

该环境使用 Python 3.10.19,属于较新的 3.10 系列,兼容 Transformers / PyTorch / IndexTTS2 相关的主流依赖。


二、CUDA 信息

IndexTTS2 依赖 GPU 加速,环境中安装了 CUDA 11.7 的编译工具链。

CUDA 编译器版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

PyTorch 版本与 CUDA 绑定

pip 包信息显示:

  • torch==2.4.0+cu118
  • torchaudio==2.4.0+cu118

说明 PyTorch 使用 CUDA 11.8 的预编译版本,并且与系统的 CUDA 11.7 工具链兼容。


三、IndexTTS2 相关依赖组成

IndexTTS2 使用的大部分依赖来自 NLP、语音处理、生成式模型等常用生态。 以下为核心依赖分类介绍,便于理解环境构成。


1. 语音处理类库

这些库用于音频读取、特征提取、声码器推理等:

  • librosa
  • soundfile
  • soxr
  • pydub
  • audioread
  • ffmpeg-python, ffmpy

这些工具帮助完成音频预处理、采样率转换、特征计算,是 IndexTTS2 的关键组件。


2. 模型推理与深度学习框架

  • torch==2.4.0+cu118
  • triton
  • transformers==4.52.1
  • accelerate

IndexTTS2 的大模型部分(声学模型、后处理模型)依赖上述框架进行推理与加速优化。


3. 文本处理相关依赖

包括分词、G2P(字音转换)、语言处理:

  • jieba
  • g2p-en
  • pynini
  • sentencepiece
  • cn2an
  • textstat

这些依赖对中英文文本前处理、文本规范化(TN)非常重要。


4. HuggingFace 全家桶

  • huggingface-hub
  • hf_transfer
  • hf-xet
  • accelerate
  • transformers

用于加载 IndexTTS2 需要的 pretrained 模型权重。


5. Web 服务相关依赖(适合部署 API)

IndexTTS2 可作为服务部署,因此需要:

  • fastapi
  • uvicorn
  • starlette
  • Flask
  • pydantic

便于构建 RESTful API 和 WebUI。


6. 前端 / UI 依赖

如果使用 Gradio 部署可视化页面:

  • gradio
  • gradio_client

四、完整 pip 包列表

以下为环境中完整的 pip 包内容,用于备份、比对或迁移(如 Docker 镜像制作)。

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ pip list
Package                  Version      Build
------------------------ ------------ -----
absl-py                  2.3.1
accelerate               1.8.1
aiofiles                 24.1.0
annotated-doc            0.0.4
annotated-types          0.7.0
antlr4-python3-runtime   4.9.3
anyio                    4.12.0
argbind                  0.3.9
asttokens                3.0.1
audioread                3.1.0
bce-python-sdk           0.9.54
blinker                  1.9.0
brotli                   1.2.0
cachetools               6.2.2
certifi                  2025.11.12
cffi                     2.0.0
charset-normalizer       3.4.4
click                    8.3.1
cn2an                    0.5.22
contourpy                1.3.2
cycler                   0.12.1
Cython                   3.0.7
decorator                5.2.1
descript-audiotools      0.7.2
Distance                 0.1.3
docstring_parser         0.17.0
einops                   0.8.1
exceptiongroup           1.3.1
executing                2.2.1
fastapi                  0.122.0
ffmpeg-python            0.2.0
ffmpy                    1.0.0
filelock                 3.20.0
fire                     0.7.1
Flask                    3.1.2
flatten-dict             0.4.2
fonttools                4.61.0
fsspec                   2025.10.0
future                   1.0.0
g2p-en                   2.1.0
google-auth              2.43.0
google-auth-oauthlib     0.4.6
gradio                   6.0.1
gradio_client            2.0.0
groovy                   0.1.2
grpcio                   1.76.0
h11                      0.16.0
hf_transfer              0.1.9
hf-xet                   1.2.0
httpcore                 1.0.9
httpx                    0.28.1
huggingface-hub          0.34.0
idna                     3.11
importlib_resources      6.5.2
inflect                  7.5.0
inquirerpy               0.3.4
ipython                  8.37.0
itsdangerous             2.2.0
jedi                     0.19.2
jieba                    0.42.1
Jinja2                   3.1.6
joblib                   1.5.2
json5                    0.10.0
julius                   0.2.7
keras                    2.9.0
kiwisolver               1.4.9
lazy_loader              0.4
librosa                  0.10.2.post1
llvmlite                 0.41.1
Markdown                 3.10
markdown-it-py           4.0.0
markdown2                2.5.4
MarkupSafe               3.0.3
matplotlib               3.8.2
matplotlib-inline        0.2.1
mdurl                    0.1.2
modelscope               1.27.0
more-itertools           10.8.0
mpmath                   1.3.0
msgpack                  1.1.2
munch                    4.0.0
networkx                 3.4.2
nltk                     3.9.2
numba                    0.58.1
numpy                    1.26.2
nvidia-cublas-cu11       11.11.3.6
nvidia-cuda-cupti-cu11   11.8.87
nvidia-cuda-nvrtc-cu11   11.8.89
nvidia-cuda-runtime-cu11 11.8.89
nvidia-cudnn-cu11        9.1.0.70
nvidia-cufft-cu11        10.9.0.58
nvidia-curand-cu11       10.3.0.86
nvidia-cusolver-cu11     11.4.1.48
nvidia-cusparse-cu11     11.7.5.86
nvidia-nccl-cu11         2.20.5
nvidia-nvtx-cu11         11.8.86
oauthlib                 3.3.1
omegaconf                2.3.0
opencv-python            4.9.0.80
orjson                   3.11.4
packaging                25.0
pandas                   2.3.2
parso                    0.8.5
pexpect                  4.9.0
pfzy                     0.3.4
pillow                   12.0.0
pip                      25.3
platformdirs             4.5.0
pooch                    1.8.2
proces                   0.1.7
prompt_toolkit           3.0.52
protobuf                 3.19.6
psutil                   7.1.3
ptyprocess               0.7.0
pure_eval                0.2.3
pyasn1                   0.6.1
pyasn1_modules           0.4.2
pycparser                2.23
pycryptodome             3.23.0
pydantic                 2.12.4
pydantic_core            2.41.5
pydub                    0.25.1
Pygments                 2.19.2
pyloudnorm               0.1.1
pynini                   2.1.5
pyparsing                3.2.5
pyphen                   0.17.2
pystoi                   0.4.1
python-dateutil          2.9.0.post0
python-multipart         0.0.20
pytz                     2025.2
PyYAML                   6.0.3
randomname               0.2.1
regex                    2025.11.3
requests                 2.32.5
requests-oauthlib        2.0.0
rich                     14.2.0
rsa                      4.9.1
safehttpx                0.1.7
safetensors              0.5.2
scikit-learn             1.7.2
scipy                    1.15.3
semantic-version         2.10.0
sentencepiece            0.2.1
setuptools               80.9.0
shellingham              1.5.4
six                      1.17.0
soundfile                0.13.1
soxr                     1.0.0
stack-data               0.6.3
starlette                0.50.0
sympy                    1.14.0
tensorboard              2.9.1
tensorboard-data-server  0.6.1
tensorboard-plugin-wit   1.8.1
termcolor                3.2.0
textstat                 0.7.11
threadpoolctl            3.6.0
tokenizers               0.21.0
tomlkit                  0.13.3
torch                    2.4.0+cu118
torch-stoi               0.2.3
torchaudio               2.4.0+cu118
tqdm                     4.67.1
traitlets                5.14.3
transformers             4.52.1
triton                   3.0.0        1
typeguard                4.4.4
typer                    0.20.0
typer-slim               0.20.0
typing_extensions        4.15.0
typing-inspection        0.4.2
tzdata                   2025.2
urllib3                  2.5.0
uvicorn                  0.38.0
wcwidth                  0.2.14
Werkzeug                 3.1.3
WeTextProcessing         1.0.3
wheel                    0.45.1

五、总结

本篇博客介绍了 IndexTTS2 在 py310 Conda 环境中的:

  • Python 基础环境
  • CUDA 加速环境
  • 完整的依赖组件分类
  • pip 包完整清单

该环境可直接作为 IndexTTS2 的运行环境基准,用于部署、测试或迁移。

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
Statistics 证件照 Hotel WebCrawler Heatmap Freesound Streamlit FlashAttention PIP 飞书 Bert VSCode Distillation WAN git-lfs 音频 RGB Nginx QWEN Translation NameSilo Jupyter Food Jetson Vmess 财报 Python FP64 torchinfo Firewall XML Magnet 域名 SAM 签证 RAR Tensor OpenCV HuggingFace Michelin Domain Linux Hilton BeautifulSoup 多线程 git tar TSV UI 搞笑 Math Shortcut Ubuntu Numpy Bitcoin Website OCR HaggingFace BTC 公式 uwsgi Conda mmap EXCEL Hungarian Permission Quantization LoRA ONNX Pillow Vim CUDA Knowledge 版权 Disk FP8 Mixtral 腾讯云 Excel InvalidArgumentError 关于博主 Bin NLP 继承 CAM v2ray scipy Crawler Animate Use OpenAI NLTK AI SQL Qwen2 diffusers Tracking IndexTTS2 多进程 Paper COCO CTC Web uWSGI Git Pandas UNIX Ptyhon VPN Safetensors DeepStream Card ChatGPT Land CC Markdown Anaconda Plate Datetime LaTeX SVR Google Data Augmentation Algorithm Windows ModelScope CV PDF LLM Input CSV PyCharm llama.cpp 阿里云 hf Logo Claude Clash Random tqdm Quantize Cloudreve YOLO printf Proxy Gemma GGML BF16 Qwen2.5 Pytorch FastAPI MD5 FP32 Password 报税 Pickle LeetCode SPIE Video logger TensorFlow GIT ResNet-50 Base64 CEIR 算法题 Tiktoken PDB Template Bipartite Attention Baidu Plotly Breakpoint Django v0.dev Color VGG-16 LLAMA XGBoost Qwen transformers Review TTS Dataset JSON Zip GoogLeNet Image2Text Paddle Interview GPTQ Github FP16 PyTorch SQLite Sklearn Miniforge GPT4 Docker DeepSeek TensorRT C++ Transformers API Diagram Llama CLAP 净利润
站点统计

本站现有博文309篇,共被浏览730451

本站已经建立2367天!

热门文章
文章归档
回到顶部