架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 86|回复: 0

B 站开源项目 IndexTTS 部署教程

[复制链接]
发表于 4 天前 | 显示全部楼层 |阅读模式
首先,不支持 Windows 系统,Windows 安装依赖会报错:https://github.com/index-tts/index-tts/issues/28

回顾:
“Kokoro-82M”最近爆火的文本转语音 TTS 模型
https://www.itsvse.com/thread-10928-1-1.html

IndexTTS

工业级可控高效零样本文本转语音系统

IndexTTS是一个基于 GPT 风格的文本转语音 (TTS) 模型,主要基于 XTTS 和 Tortoise 算法。它能够通过拼音纠正汉字发音,并通过标点符号控制任意位置的停顿。我们增强了系统的多个模块,包括改进说话人条件特征表示,并集成 BigVGAN2 以优化音频质量。我们的系统基于数万小时的数据进行训练,达到了最佳性能,超越了目前流行的 TTS 系统,例如 XTTS、CosyVoice2、Fish-Speech 和 F5-TTS。

项目地址:https://github.com/index-tts/index-tts
在线体验地址:https://huggingface.co/spaces/IndexTeam/IndexTTS
模型下载:https://huggingface.co/IndexTeam/IndexTTS-1.5

模型效果:IndexTTS-1.5 > IndexTTS

IndexTTS 的概览如下:

cf14ae60dc68b3e633ceea735e7b24f0.png

IndexTTS 部署

硬件:CPU N150,内存:16G,系统:Rocky Linux 9

安装 conda 略,请参考之前的文章。

使用 conda 创建环境

下载模型
8de45d52af4e6e2a22c3b485d783bd30.png
安装依赖和克隆 index-tts 项目

41c5545b21495384f37ed2bbc2edceb0.png

推理测试

f1c23585113d62e02e61efbd0fef3577.png

可以看到已经生成 output.wav 语音文件。(由于我的 CPU 性能比较弱,耗时比较久)

(完)




上一篇:.NET/C# 通过 DataTable 动态创建表结构
下一篇:【Playwright】(一)Playwright for .NET 使用教程
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2025-5-30 17:20

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表