EADST

IndexTTS2 环境说明与依赖分析(Linux / Conda py310)

本文主要介绍 IndexTTS2 在 Linux 环境中的依赖情况,并展示当前环境的 Python 版本、CUDA 版本以及完整的 pip 包列表,方便后续部署、迁移或问题排查。


一、环境基础信息

本环境基于 Conda 创建的 Python 3.10 环境(名称:py310),主要用于运行 IndexTTS2 及其相关生态工具。

Python 版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ python
Python 3.10.19 (main, Oct 21 2025, 16:43:05) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()

该环境使用 Python 3.10.19,属于较新的 3.10 系列,兼容 Transformers / PyTorch / IndexTTS2 相关的主流依赖。


二、CUDA 信息

IndexTTS2 依赖 GPU 加速,环境中安装了 CUDA 11.7 的编译工具链。

CUDA 编译器版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

PyTorch 版本与 CUDA 绑定

pip 包信息显示:

  • torch==2.4.0+cu118
  • torchaudio==2.4.0+cu118

说明 PyTorch 使用 CUDA 11.8 的预编译版本,并且与系统的 CUDA 11.7 工具链兼容。


三、IndexTTS2 相关依赖组成

IndexTTS2 使用的大部分依赖来自 NLP、语音处理、生成式模型等常用生态。 以下为核心依赖分类介绍,便于理解环境构成。


1. 语音处理类库

这些库用于音频读取、特征提取、声码器推理等:

  • librosa
  • soundfile
  • soxr
  • pydub
  • audioread
  • ffmpeg-python, ffmpy

这些工具帮助完成音频预处理、采样率转换、特征计算,是 IndexTTS2 的关键组件。


2. 模型推理与深度学习框架

  • torch==2.4.0+cu118
  • triton
  • transformers==4.52.1
  • accelerate

IndexTTS2 的大模型部分(声学模型、后处理模型)依赖上述框架进行推理与加速优化。


3. 文本处理相关依赖

包括分词、G2P(字音转换)、语言处理:

  • jieba
  • g2p-en
  • pynini
  • sentencepiece
  • cn2an
  • textstat

这些依赖对中英文文本前处理、文本规范化(TN)非常重要。


4. HuggingFace 全家桶

  • huggingface-hub
  • hf_transfer
  • hf-xet
  • accelerate
  • transformers

用于加载 IndexTTS2 需要的 pretrained 模型权重。


5. Web 服务相关依赖(适合部署 API)

IndexTTS2 可作为服务部署,因此需要:

  • fastapi
  • uvicorn
  • starlette
  • Flask
  • pydantic

便于构建 RESTful API 和 WebUI。


6. 前端 / UI 依赖

如果使用 Gradio 部署可视化页面:

  • gradio
  • gradio_client

四、完整 pip 包列表

以下为环境中完整的 pip 包内容,用于备份、比对或迁移(如 Docker 镜像制作)。

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ pip list
Package                  Version      Build
------------------------ ------------ -----
absl-py                  2.3.1
accelerate               1.8.1
aiofiles                 24.1.0
annotated-doc            0.0.4
annotated-types          0.7.0
antlr4-python3-runtime   4.9.3
anyio                    4.12.0
argbind                  0.3.9
asttokens                3.0.1
audioread                3.1.0
bce-python-sdk           0.9.54
blinker                  1.9.0
brotli                   1.2.0
cachetools               6.2.2
certifi                  2025.11.12
cffi                     2.0.0
charset-normalizer       3.4.4
click                    8.3.1
cn2an                    0.5.22
contourpy                1.3.2
cycler                   0.12.1
Cython                   3.0.7
decorator                5.2.1
descript-audiotools      0.7.2
Distance                 0.1.3
docstring_parser         0.17.0
einops                   0.8.1
exceptiongroup           1.3.1
executing                2.2.1
fastapi                  0.122.0
ffmpeg-python            0.2.0
ffmpy                    1.0.0
filelock                 3.20.0
fire                     0.7.1
Flask                    3.1.2
flatten-dict             0.4.2
fonttools                4.61.0
fsspec                   2025.10.0
future                   1.0.0
g2p-en                   2.1.0
google-auth              2.43.0
google-auth-oauthlib     0.4.6
gradio                   6.0.1
gradio_client            2.0.0
groovy                   0.1.2
grpcio                   1.76.0
h11                      0.16.0
hf_transfer              0.1.9
hf-xet                   1.2.0
httpcore                 1.0.9
httpx                    0.28.1
huggingface-hub          0.34.0
idna                     3.11
importlib_resources      6.5.2
inflect                  7.5.0
inquirerpy               0.3.4
ipython                  8.37.0
itsdangerous             2.2.0
jedi                     0.19.2
jieba                    0.42.1
Jinja2                   3.1.6
joblib                   1.5.2
json5                    0.10.0
julius                   0.2.7
keras                    2.9.0
kiwisolver               1.4.9
lazy_loader              0.4
librosa                  0.10.2.post1
llvmlite                 0.41.1
Markdown                 3.10
markdown-it-py           4.0.0
markdown2                2.5.4
MarkupSafe               3.0.3
matplotlib               3.8.2
matplotlib-inline        0.2.1
mdurl                    0.1.2
modelscope               1.27.0
more-itertools           10.8.0
mpmath                   1.3.0
msgpack                  1.1.2
munch                    4.0.0
networkx                 3.4.2
nltk                     3.9.2
numba                    0.58.1
numpy                    1.26.2
nvidia-cublas-cu11       11.11.3.6
nvidia-cuda-cupti-cu11   11.8.87
nvidia-cuda-nvrtc-cu11   11.8.89
nvidia-cuda-runtime-cu11 11.8.89
nvidia-cudnn-cu11        9.1.0.70
nvidia-cufft-cu11        10.9.0.58
nvidia-curand-cu11       10.3.0.86
nvidia-cusolver-cu11     11.4.1.48
nvidia-cusparse-cu11     11.7.5.86
nvidia-nccl-cu11         2.20.5
nvidia-nvtx-cu11         11.8.86
oauthlib                 3.3.1
omegaconf                2.3.0
opencv-python            4.9.0.80
orjson                   3.11.4
packaging                25.0
pandas                   2.3.2
parso                    0.8.5
pexpect                  4.9.0
pfzy                     0.3.4
pillow                   12.0.0
pip                      25.3
platformdirs             4.5.0
pooch                    1.8.2
proces                   0.1.7
prompt_toolkit           3.0.52
protobuf                 3.19.6
psutil                   7.1.3
ptyprocess               0.7.0
pure_eval                0.2.3
pyasn1                   0.6.1
pyasn1_modules           0.4.2
pycparser                2.23
pycryptodome             3.23.0
pydantic                 2.12.4
pydantic_core            2.41.5
pydub                    0.25.1
Pygments                 2.19.2
pyloudnorm               0.1.1
pynini                   2.1.5
pyparsing                3.2.5
pyphen                   0.17.2
pystoi                   0.4.1
python-dateutil          2.9.0.post0
python-multipart         0.0.20
pytz                     2025.2
PyYAML                   6.0.3
randomname               0.2.1
regex                    2025.11.3
requests                 2.32.5
requests-oauthlib        2.0.0
rich                     14.2.0
rsa                      4.9.1
safehttpx                0.1.7
safetensors              0.5.2
scikit-learn             1.7.2
scipy                    1.15.3
semantic-version         2.10.0
sentencepiece            0.2.1
setuptools               80.9.0
shellingham              1.5.4
six                      1.17.0
soundfile                0.13.1
soxr                     1.0.0
stack-data               0.6.3
starlette                0.50.0
sympy                    1.14.0
tensorboard              2.9.1
tensorboard-data-server  0.6.1
tensorboard-plugin-wit   1.8.1
termcolor                3.2.0
textstat                 0.7.11
threadpoolctl            3.6.0
tokenizers               0.21.0
tomlkit                  0.13.3
torch                    2.4.0+cu118
torch-stoi               0.2.3
torchaudio               2.4.0+cu118
tqdm                     4.67.1
traitlets                5.14.3
transformers             4.52.1
triton                   3.0.0        1
typeguard                4.4.4
typer                    0.20.0
typer-slim               0.20.0
typing_extensions        4.15.0
typing-inspection        0.4.2
tzdata                   2025.2
urllib3                  2.5.0
uvicorn                  0.38.0
wcwidth                  0.2.14
Werkzeug                 3.1.3
WeTextProcessing         1.0.3
wheel                    0.45.1

五、总结

本篇博客介绍了 IndexTTS2 在 py310 Conda 环境中的:

  • Python 基础环境
  • CUDA 加速环境
  • 完整的依赖组件分类
  • pip 包完整清单

该环境可直接作为 IndexTTS2 的运行环境基准,用于部署、测试或迁移。

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
DeepSeek Anaconda tqdm HuggingFace Search JSON Sklearn 腾讯云 Web Streamlit FP8 Interview icon Numpy Template Animate LLAMA EXCEL 云服务器 FastAPI PyTorch TTS Mixtral Pillow GoogLeNet Vim XML 证件照 Card Miniforge Password CEIR FP64 printf tar Use COCO GGML 签证 Data CC NLP v0.dev transformers Base64 Django Tensor Paper Quantization 公式 YOLO Plate 强化学习 财报 Crawler Conda Transformers News ModelScope Domain CV git-lfs UNIX Paddle Jupyter 第一性原理 SAM Python AI FlashAttention C++ Claude TensorRT OpenAI uwsgi CLAP 多线程 图标 SQLite Magnet Nginx BTC git UI Rebuttal Attention Permission VPN BF16 VGG-16 Git Quantize XGBoost Augmentation Docker Hotel Food 报税 阿里云 Ptyhon SQL FP16 Website Proxy WAN PIP LLM DeepStream Algorithm Logo Diagram OpenCV Vmess Land Shortcut Gemma Disk Video GPT4 Safetensors Statistics CUDA WebCrawler 图形思考法 ResNet-50 SVR LeetCode Datetime NameSilo v2ray Dataset Baidu PDF Image2Text Review Llama Michelin LoRA Bert 顶会 torchinfo 域名 多进程 ONNX VSCode API BeautifulSoup Math Hungarian CAM Bitcoin TensorFlow 算法题 LaTeX hf Color HaggingFace Tracking Cloudreve PyCharm CTC RAR Breakpoint Freesound OCR Google QWEN logger CSV 搞笑 GIT FP32 Pytorch Bin scipy NLTK Hilton diffusers Qwen Clash 递归学习法 关于博主 Random IndexTTS2 Excel Linux ChatGPT Plotly PDB Knowledge 继承 Distillation 飞书 MD5 Jetson Github Tiktoken Agent 净利润 Windows 音频 mmap llama.cpp Qwen2 SPIE Pickle RGB TSV Input Pandas 版权 Markdown Bipartite Zip Qwen2.5 Ubuntu uWSGI Translation InvalidArgumentError Firewall GPTQ Heatmap
站点统计

本站现有博文323篇,共被浏览798705

本站已经建立2497天!

热门文章
文章归档
回到顶部