分享
AI听书
输入“/”快速插入内容
AI听书
AI听书是针对听书的家人们,特别优化后的一个项目。不会频繁更新,永久免费!
当然作者为了吃饭,会通过其他方式获取收益,但并不会影响到家人们正常的软件使用。
AI听书会分为不同TTS引擎不同版本,家人们可以可以根据自己的需求和配置选择合适的版本就可以了!
版本
1.
GPT-SoVITS-V4
配置要求: 8c16G(CPU推理)
N卡:V1/V2模型至少4G V3模型:6G以上
下载地址:
https://pan.quark.cn/s/1f3caf3bbca3
V3版本:
https://pan.quark.cn/s/161d3b6158e2
2.
F5-TTS-V1
配置要求: 8c16G(CPU推理)
N卡:4G
其他:如果需要自己折腾其他设备,可以自行修改f5_tts/api.py
下载地址:
https://pan.quark.cn/s/bf48b8e60edb
3.
MegaTTS3
效果确实很好,但是对配置要求有点高,具体什么配置能做到1:1不太清楚,4090只能做到1:1.2左右。
下载地址:
https://pan.quark.cn/s/664067d16569
4.
IndexTTS2
下载地址:
https://pan.quark.cn/s/c0d85687acb3
安装教程
1.
下载压缩包,解压到没有中文的文件夹下面。
2.
启动AI听书
视频
常见问题
1.怎么修改启动端口?
打开
configs/config.json
,修改里面的server.port, 注意端口要在1000-65500之间!
2.怎么查看电脑端的IP?
在终端中执行`ipconfig |findstr v4`,一般是192.168.1.x或者192.168.0.x
50%
50%
3.怎么使用自己的模型?
GPT SoVITS版本
1.
在根目录下面创建
models2
文件夹
2.
创建
说话人
目录
3.
将ckpt和pth拷贝到
models2/说话人
目录下面。(就是训练后的两个模型文件,支持V1-V3模型)
4.
将参考音频重命名成”情感#zh#参考音频文字内容.wav” ,语言可选为zh/ja/en,三种。
5.
设置好,可以重启软件或者在音色界面上点击刷新查看是否能正常显示。
50%
50%