EADST

IndexTTS2 环境说明与依赖分析(Linux / Conda py310)

本文主要介绍 IndexTTS2 在 Linux 环境中的依赖情况,并展示当前环境的 Python 版本、CUDA 版本以及完整的 pip 包列表,方便后续部署、迁移或问题排查。


一、环境基础信息

本环境基于 Conda 创建的 Python 3.10 环境(名称:py310),主要用于运行 IndexTTS2 及其相关生态工具。

Python 版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ python
Python 3.10.19 (main, Oct 21 2025, 16:43:05) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()

该环境使用 Python 3.10.19,属于较新的 3.10 系列,兼容 Transformers / PyTorch / IndexTTS2 相关的主流依赖。


二、CUDA 信息

IndexTTS2 依赖 GPU 加速,环境中安装了 CUDA 11.7 的编译工具链。

CUDA 编译器版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

PyTorch 版本与 CUDA 绑定

pip 包信息显示:

  • torch==2.4.0+cu118
  • torchaudio==2.4.0+cu118

说明 PyTorch 使用 CUDA 11.8 的预编译版本,并且与系统的 CUDA 11.7 工具链兼容。


三、IndexTTS2 相关依赖组成

IndexTTS2 使用的大部分依赖来自 NLP、语音处理、生成式模型等常用生态。 以下为核心依赖分类介绍,便于理解环境构成。


1. 语音处理类库

这些库用于音频读取、特征提取、声码器推理等:

  • librosa
  • soundfile
  • soxr
  • pydub
  • audioread
  • ffmpeg-python, ffmpy

这些工具帮助完成音频预处理、采样率转换、特征计算,是 IndexTTS2 的关键组件。


2. 模型推理与深度学习框架

  • torch==2.4.0+cu118
  • triton
  • transformers==4.52.1
  • accelerate

IndexTTS2 的大模型部分(声学模型、后处理模型)依赖上述框架进行推理与加速优化。


3. 文本处理相关依赖

包括分词、G2P(字音转换)、语言处理:

  • jieba
  • g2p-en
  • pynini
  • sentencepiece
  • cn2an
  • textstat

这些依赖对中英文文本前处理、文本规范化(TN)非常重要。


4. HuggingFace 全家桶

  • huggingface-hub
  • hf_transfer
  • hf-xet
  • accelerate
  • transformers

用于加载 IndexTTS2 需要的 pretrained 模型权重。


5. Web 服务相关依赖(适合部署 API)

IndexTTS2 可作为服务部署,因此需要:

  • fastapi
  • uvicorn
  • starlette
  • Flask
  • pydantic

便于构建 RESTful API 和 WebUI。


6. 前端 / UI 依赖

如果使用 Gradio 部署可视化页面:

  • gradio
  • gradio_client

四、完整 pip 包列表

以下为环境中完整的 pip 包内容,用于备份、比对或迁移(如 Docker 镜像制作)。

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ pip list
Package                  Version      Build
------------------------ ------------ -----
absl-py                  2.3.1
accelerate               1.8.1
aiofiles                 24.1.0
annotated-doc            0.0.4
annotated-types          0.7.0
antlr4-python3-runtime   4.9.3
anyio                    4.12.0
argbind                  0.3.9
asttokens                3.0.1
audioread                3.1.0
bce-python-sdk           0.9.54
blinker                  1.9.0
brotli                   1.2.0
cachetools               6.2.2
certifi                  2025.11.12
cffi                     2.0.0
charset-normalizer       3.4.4
click                    8.3.1
cn2an                    0.5.22
contourpy                1.3.2
cycler                   0.12.1
Cython                   3.0.7
decorator                5.2.1
descript-audiotools      0.7.2
Distance                 0.1.3
docstring_parser         0.17.0
einops                   0.8.1
exceptiongroup           1.3.1
executing                2.2.1
fastapi                  0.122.0
ffmpeg-python            0.2.0
ffmpy                    1.0.0
filelock                 3.20.0
fire                     0.7.1
Flask                    3.1.2
flatten-dict             0.4.2
fonttools                4.61.0
fsspec                   2025.10.0
future                   1.0.0
g2p-en                   2.1.0
google-auth              2.43.0
google-auth-oauthlib     0.4.6
gradio                   6.0.1
gradio_client            2.0.0
groovy                   0.1.2
grpcio                   1.76.0
h11                      0.16.0
hf_transfer              0.1.9
hf-xet                   1.2.0
httpcore                 1.0.9
httpx                    0.28.1
huggingface-hub          0.34.0
idna                     3.11
importlib_resources      6.5.2
inflect                  7.5.0
inquirerpy               0.3.4
ipython                  8.37.0
itsdangerous             2.2.0
jedi                     0.19.2
jieba                    0.42.1
Jinja2                   3.1.6
joblib                   1.5.2
json5                    0.10.0
julius                   0.2.7
keras                    2.9.0
kiwisolver               1.4.9
lazy_loader              0.4
librosa                  0.10.2.post1
llvmlite                 0.41.1
Markdown                 3.10
markdown-it-py           4.0.0
markdown2                2.5.4
MarkupSafe               3.0.3
matplotlib               3.8.2
matplotlib-inline        0.2.1
mdurl                    0.1.2
modelscope               1.27.0
more-itertools           10.8.0
mpmath                   1.3.0
msgpack                  1.1.2
munch                    4.0.0
networkx                 3.4.2
nltk                     3.9.2
numba                    0.58.1
numpy                    1.26.2
nvidia-cublas-cu11       11.11.3.6
nvidia-cuda-cupti-cu11   11.8.87
nvidia-cuda-nvrtc-cu11   11.8.89
nvidia-cuda-runtime-cu11 11.8.89
nvidia-cudnn-cu11        9.1.0.70
nvidia-cufft-cu11        10.9.0.58
nvidia-curand-cu11       10.3.0.86
nvidia-cusolver-cu11     11.4.1.48
nvidia-cusparse-cu11     11.7.5.86
nvidia-nccl-cu11         2.20.5
nvidia-nvtx-cu11         11.8.86
oauthlib                 3.3.1
omegaconf                2.3.0
opencv-python            4.9.0.80
orjson                   3.11.4
packaging                25.0
pandas                   2.3.2
parso                    0.8.5
pexpect                  4.9.0
pfzy                     0.3.4
pillow                   12.0.0
pip                      25.3
platformdirs             4.5.0
pooch                    1.8.2
proces                   0.1.7
prompt_toolkit           3.0.52
protobuf                 3.19.6
psutil                   7.1.3
ptyprocess               0.7.0
pure_eval                0.2.3
pyasn1                   0.6.1
pyasn1_modules           0.4.2
pycparser                2.23
pycryptodome             3.23.0
pydantic                 2.12.4
pydantic_core            2.41.5
pydub                    0.25.1
Pygments                 2.19.2
pyloudnorm               0.1.1
pynini                   2.1.5
pyparsing                3.2.5
pyphen                   0.17.2
pystoi                   0.4.1
python-dateutil          2.9.0.post0
python-multipart         0.0.20
pytz                     2025.2
PyYAML                   6.0.3
randomname               0.2.1
regex                    2025.11.3
requests                 2.32.5
requests-oauthlib        2.0.0
rich                     14.2.0
rsa                      4.9.1
safehttpx                0.1.7
safetensors              0.5.2
scikit-learn             1.7.2
scipy                    1.15.3
semantic-version         2.10.0
sentencepiece            0.2.1
setuptools               80.9.0
shellingham              1.5.4
six                      1.17.0
soundfile                0.13.1
soxr                     1.0.0
stack-data               0.6.3
starlette                0.50.0
sympy                    1.14.0
tensorboard              2.9.1
tensorboard-data-server  0.6.1
tensorboard-plugin-wit   1.8.1
termcolor                3.2.0
textstat                 0.7.11
threadpoolctl            3.6.0
tokenizers               0.21.0
tomlkit                  0.13.3
torch                    2.4.0+cu118
torch-stoi               0.2.3
torchaudio               2.4.0+cu118
tqdm                     4.67.1
traitlets                5.14.3
transformers             4.52.1
triton                   3.0.0        1
typeguard                4.4.4
typer                    0.20.0
typer-slim               0.20.0
typing_extensions        4.15.0
typing-inspection        0.4.2
tzdata                   2025.2
urllib3                  2.5.0
uvicorn                  0.38.0
wcwidth                  0.2.14
Werkzeug                 3.1.3
WeTextProcessing         1.0.3
wheel                    0.45.1

五、总结

本篇博客介绍了 IndexTTS2 在 py310 Conda 环境中的:

  • Python 基础环境
  • CUDA 加速环境
  • 完整的依赖组件分类
  • pip 包完整清单

该环境可直接作为 IndexTTS2 的运行环境基准,用于部署、测试或迁移。

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
Translation Plotly 第一性原理 tqdm Hilton Proxy UNIX Land FP64 tar Safetensors Mixtral 关于博主 Permission DeepStream Jetson Michelin TTS GPTQ 多线程 Template Numpy Algorithm TSV Excel Color QWEN TensorFlow 音频 Django Tensor Video diffusers LoRA Anaconda Bert Qwen Magnet Nginx 云服务器 LLAMA ModelScope Hotel Markdown Crawler LeetCode Firewall Zip OCR Llama Qwen2.5 XGBoost BeautifulSoup ONNX Conda Pickle Animate Diagram PyCharm LLM Logo COCO GPT4 公式 域名 Github Clash Plate AI Baidu Pillow 继承 ChatGPT Windows FP16 证件照 SAM WebCrawler v2ray Datetime CC CUDA SQLite YOLO Augmentation Gemma Statistics FastAPI Quantization Review uWSGI Password EXCEL SPIE Tiktoken Dataset Ptyhon CTC BTC Claude 算法题 CV Qwen2 Base64 Input GoogLeNet HaggingFace IndexTTS2 CSV VPN CEIR 报税 llama.cpp 多进程 递归学习法 RAR Pandas Quantize scipy API VSCode Image2Text Vmess Cloudreve Website hf Linux DeepSeek NLTK Search TensorRT git-lfs 搞笑 Use v0.dev Distillation Freesound FP32 WAN MD5 torchinfo HuggingFace Food C++ UI Math Miniforge PDF Google OpenAI Domain Bitcoin 强化学习 ResNet-50 Jupyter SQL Knowledge Transformers printf GGML FP8 RGB Web Shortcut GIT 顶会 InvalidArgumentError Paper Sklearn PyTorch FlashAttention XML Hungarian SVR Docker NameSilo logger OpenCV News Interview LaTeX 签证 Disk Bipartite Data Python 腾讯云 VGG-16 Pytorch Vim Tracking 阿里云 Card Streamlit Breakpoint JSON 飞书 PDB 净利润 uwsgi PIP Random NLP 财报 CLAP Ubuntu Attention Bin CAM 版权 mmap Agent git Heatmap 图形思考法 Git BF16 transformers Paddle
站点统计

本站现有博文321篇,共被浏览768937

本站已经建立2454天!

热门文章
文章归档
回到顶部