EADST

IndexTTS2 环境说明与依赖分析(Linux / Conda py310)

本文主要介绍 IndexTTS2 在 Linux 环境中的依赖情况,并展示当前环境的 Python 版本、CUDA 版本以及完整的 pip 包列表,方便后续部署、迁移或问题排查。


一、环境基础信息

本环境基于 Conda 创建的 Python 3.10 环境(名称:py310),主要用于运行 IndexTTS2 及其相关生态工具。

Python 版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ python
Python 3.10.19 (main, Oct 21 2025, 16:43:05) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()

该环境使用 Python 3.10.19,属于较新的 3.10 系列,兼容 Transformers / PyTorch / IndexTTS2 相关的主流依赖。


二、CUDA 信息

IndexTTS2 依赖 GPU 加速,环境中安装了 CUDA 11.7 的编译工具链。

CUDA 编译器版本

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

PyTorch 版本与 CUDA 绑定

pip 包信息显示:

  • torch==2.4.0+cu118
  • torchaudio==2.4.0+cu118

说明 PyTorch 使用 CUDA 11.8 的预编译版本,并且与系统的 CUDA 11.7 工具链兼容。


三、IndexTTS2 相关依赖组成

IndexTTS2 使用的大部分依赖来自 NLP、语音处理、生成式模型等常用生态。 以下为核心依赖分类介绍,便于理解环境构成。


1. 语音处理类库

这些库用于音频读取、特征提取、声码器推理等:

  • librosa
  • soundfile
  • soxr
  • pydub
  • audioread
  • ffmpeg-python, ffmpy

这些工具帮助完成音频预处理、采样率转换、特征计算,是 IndexTTS2 的关键组件。


2. 模型推理与深度学习框架

  • torch==2.4.0+cu118
  • triton
  • transformers==4.52.1
  • accelerate

IndexTTS2 的大模型部分(声学模型、后处理模型)依赖上述框架进行推理与加速优化。


3. 文本处理相关依赖

包括分词、G2P(字音转换)、语言处理:

  • jieba
  • g2p-en
  • pynini
  • sentencepiece
  • cn2an
  • textstat

这些依赖对中英文文本前处理、文本规范化(TN)非常重要。


4. HuggingFace 全家桶

  • huggingface-hub
  • hf_transfer
  • hf-xet
  • accelerate
  • transformers

用于加载 IndexTTS2 需要的 pretrained 模型权重。


5. Web 服务相关依赖(适合部署 API)

IndexTTS2 可作为服务部署,因此需要:

  • fastapi
  • uvicorn
  • starlette
  • Flask
  • pydantic

便于构建 RESTful API 和 WebUI。


6. 前端 / UI 依赖

如果使用 Gradio 部署可视化页面:

  • gradio
  • gradio_client

四、完整 pip 包列表

以下为环境中完整的 pip 包内容,用于备份、比对或迁移(如 Docker 镜像制作)。

(py310) root@yq02-bcc-sci-a800-25582-001.bcc-yq02.baidu.com paddlejob $ pip list
Package                  Version      Build
------------------------ ------------ -----
absl-py                  2.3.1
accelerate               1.8.1
aiofiles                 24.1.0
annotated-doc            0.0.4
annotated-types          0.7.0
antlr4-python3-runtime   4.9.3
anyio                    4.12.0
argbind                  0.3.9
asttokens                3.0.1
audioread                3.1.0
bce-python-sdk           0.9.54
blinker                  1.9.0
brotli                   1.2.0
cachetools               6.2.2
certifi                  2025.11.12
cffi                     2.0.0
charset-normalizer       3.4.4
click                    8.3.1
cn2an                    0.5.22
contourpy                1.3.2
cycler                   0.12.1
Cython                   3.0.7
decorator                5.2.1
descript-audiotools      0.7.2
Distance                 0.1.3
docstring_parser         0.17.0
einops                   0.8.1
exceptiongroup           1.3.1
executing                2.2.1
fastapi                  0.122.0
ffmpeg-python            0.2.0
ffmpy                    1.0.0
filelock                 3.20.0
fire                     0.7.1
Flask                    3.1.2
flatten-dict             0.4.2
fonttools                4.61.0
fsspec                   2025.10.0
future                   1.0.0
g2p-en                   2.1.0
google-auth              2.43.0
google-auth-oauthlib     0.4.6
gradio                   6.0.1
gradio_client            2.0.0
groovy                   0.1.2
grpcio                   1.76.0
h11                      0.16.0
hf_transfer              0.1.9
hf-xet                   1.2.0
httpcore                 1.0.9
httpx                    0.28.1
huggingface-hub          0.34.0
idna                     3.11
importlib_resources      6.5.2
inflect                  7.5.0
inquirerpy               0.3.4
ipython                  8.37.0
itsdangerous             2.2.0
jedi                     0.19.2
jieba                    0.42.1
Jinja2                   3.1.6
joblib                   1.5.2
json5                    0.10.0
julius                   0.2.7
keras                    2.9.0
kiwisolver               1.4.9
lazy_loader              0.4
librosa                  0.10.2.post1
llvmlite                 0.41.1
Markdown                 3.10
markdown-it-py           4.0.0
markdown2                2.5.4
MarkupSafe               3.0.3
matplotlib               3.8.2
matplotlib-inline        0.2.1
mdurl                    0.1.2
modelscope               1.27.0
more-itertools           10.8.0
mpmath                   1.3.0
msgpack                  1.1.2
munch                    4.0.0
networkx                 3.4.2
nltk                     3.9.2
numba                    0.58.1
numpy                    1.26.2
nvidia-cublas-cu11       11.11.3.6
nvidia-cuda-cupti-cu11   11.8.87
nvidia-cuda-nvrtc-cu11   11.8.89
nvidia-cuda-runtime-cu11 11.8.89
nvidia-cudnn-cu11        9.1.0.70
nvidia-cufft-cu11        10.9.0.58
nvidia-curand-cu11       10.3.0.86
nvidia-cusolver-cu11     11.4.1.48
nvidia-cusparse-cu11     11.7.5.86
nvidia-nccl-cu11         2.20.5
nvidia-nvtx-cu11         11.8.86
oauthlib                 3.3.1
omegaconf                2.3.0
opencv-python            4.9.0.80
orjson                   3.11.4
packaging                25.0
pandas                   2.3.2
parso                    0.8.5
pexpect                  4.9.0
pfzy                     0.3.4
pillow                   12.0.0
pip                      25.3
platformdirs             4.5.0
pooch                    1.8.2
proces                   0.1.7
prompt_toolkit           3.0.52
protobuf                 3.19.6
psutil                   7.1.3
ptyprocess               0.7.0
pure_eval                0.2.3
pyasn1                   0.6.1
pyasn1_modules           0.4.2
pycparser                2.23
pycryptodome             3.23.0
pydantic                 2.12.4
pydantic_core            2.41.5
pydub                    0.25.1
Pygments                 2.19.2
pyloudnorm               0.1.1
pynini                   2.1.5
pyparsing                3.2.5
pyphen                   0.17.2
pystoi                   0.4.1
python-dateutil          2.9.0.post0
python-multipart         0.0.20
pytz                     2025.2
PyYAML                   6.0.3
randomname               0.2.1
regex                    2025.11.3
requests                 2.32.5
requests-oauthlib        2.0.0
rich                     14.2.0
rsa                      4.9.1
safehttpx                0.1.7
safetensors              0.5.2
scikit-learn             1.7.2
scipy                    1.15.3
semantic-version         2.10.0
sentencepiece            0.2.1
setuptools               80.9.0
shellingham              1.5.4
six                      1.17.0
soundfile                0.13.1
soxr                     1.0.0
stack-data               0.6.3
starlette                0.50.0
sympy                    1.14.0
tensorboard              2.9.1
tensorboard-data-server  0.6.1
tensorboard-plugin-wit   1.8.1
termcolor                3.2.0
textstat                 0.7.11
threadpoolctl            3.6.0
tokenizers               0.21.0
tomlkit                  0.13.3
torch                    2.4.0+cu118
torch-stoi               0.2.3
torchaudio               2.4.0+cu118
tqdm                     4.67.1
traitlets                5.14.3
transformers             4.52.1
triton                   3.0.0        1
typeguard                4.4.4
typer                    0.20.0
typer-slim               0.20.0
typing_extensions        4.15.0
typing-inspection        0.4.2
tzdata                   2025.2
urllib3                  2.5.0
uvicorn                  0.38.0
wcwidth                  0.2.14
Werkzeug                 3.1.3
WeTextProcessing         1.0.3
wheel                    0.45.1

五、总结

本篇博客介绍了 IndexTTS2 在 py310 Conda 环境中的:

  • Python 基础环境
  • CUDA 加速环境
  • 完整的依赖组件分类
  • pip 包完整清单

该环境可直接作为 IndexTTS2 的运行环境基准,用于部署、测试或迁移。

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
Quantize WAN Website Ptyhon 递归学习法 Paper WebCrawler Baidu Git CSV FP16 PyCharm TSV Cloudreve Django Search Pillow 图形思考法 Pandas 顶会 Python Tiktoken Numpy Github Web Michelin 继承 SPIE 证件照 Qwen2.5 Statistics Distillation Heatmap Mixtral Firewall Clash Input 强化学习 LeetCode 腾讯云 Food Land Proxy Plotly Card tqdm UI QWEN ChatGPT News Dataset OpenAI VPN BF16 AI mmap CLAP PDB Conda Logo diffusers JSON SQLite Paddle CEIR Vim torchinfo FlashAttention Diagram PDF Bin 算法题 PIP LoRA Docker GPT4 Domain Gemma FP64 音频 LLAMA GGML 飞书 Claude uWSGI C++ NLTK CTC TensorRT SAM NLP PyTorch Knowledge Random Magnet Template UNIX SQL GIT RGB OpenCV 搞笑 CV 签证 Excel 阿里云 财报 DeepStream Tensor EXCEL Hotel Use hf BeautifulSoup IndexTTS2 Nginx transformers YOLO Qwen Ubuntu Hungarian git-lfs Pytorch Review Augmentation 公式 CAM Miniforge Llama FP32 Jupyter 报税 OCR Google HuggingFace 多进程 多线程 净利润 Safetensors llama.cpp Qwen2 Pickle Video API Breakpoint logger Sklearn CC ONNX Quantization Agent Animate CUDA MD5 FastAPI Bert Data uwsgi 关于博主 RAR Datetime InvalidArgumentError GPTQ XGBoost Algorithm HaggingFace FP8 Attention Shortcut XML Vmess BTC Zip Tracking VSCode Image2Text tar LaTeX Transformers GoogLeNet Interview LLM Windows TTS Linux Base64 Bipartite Streamlit Translation TensorFlow Plate 第一性原理 Bitcoin VGG-16 Disk Math Markdown scipy Crawler 域名 Hilton v2ray SVR Color Anaconda ModelScope NameSilo ResNet-50 COCO printf Password 版权 Permission v0.dev Jetson DeepSeek git Freesound
站点统计

本站现有博文320篇,共被浏览760829

本站已经建立2432天!

热门文章
文章归档
回到顶部