再升级!MoneyPrinterPlus集成GPT_SoVITS

最近有很多优秀的语音合成TTS工具,目前MoneyPrinterPlus已经集成了ChatTTS和fasterWhisper。应朋友们的要求,最近MoneyPrinterPlus也集成了GPT_SoVITS这个优秀的语音合成工具。

今天给大家详细讲解一下,如何在MoneyPrinterPlus中使用GPT_SoVITS。

软件准备

当然,前提条件就是你需要下载MoneyPrinterPlus软件啦。

下载地址: https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友,不妨给个star支持一下。 在软件v4.4版本之后,MoneyPrinterPlus已经支持GPT_SoVITS本地TTS语音服务啦。

启动GPT_SoVITS

GPT_SoVITS这个工具怎么安装这里就不多讲了。

我们讲下如何跟MoneyPrinterPlus进行合作配置。

GPT_SoVITS有很多功能,包括语音训练,模型微调,TTS语音推理,变声等功能。

这里我们使用的是GPT_SoVITS的核心TTS语音推理功能。

首先我们启动GPT_SoVITS:

在1-GPT-SoVITS-TTS —》 1C推理 —》 开启TTS推理webUI

image-20240814101451460

然后你就可以看到这样的TTS推理界面:

image-20240814103843764

你可以选择参考音频,参考文本,参考音频的语言。

然后可以输入要合成的文本,合成语音的类别,语速,top_k, top_p和temperature。

当然,上面的都不重要,我们不需要通过webUI来调用GPT_SoVITS,我们需要的是通过API来和GPT_SoVITS进行交互。

API启动GPT_SoVITS

如果下载的是GPT_SoVITS的集合包,那么可以直接执行下面的命令来启动GPT_SoVITS的API:

启动api: runtime\python.exe api.py 

启动之后,你会看到下面的内容:

image-20240814002404640

上面的启动是最简单的启动,没有指定参考音频,如果你想指定参考音频的话,可以执行下面的命令:

python api.py -dr "123.wav" -dt "一二三。" -dl "zh" 

当然,还有其他的一些启动参数如下:

`-dr` - `默认参考音频路径`
`-dt` - `默认参考音频文本`
`-dl` - `默认参考音频语种, "中文","英文","日文","韩文","粤语,"zh","en","ja","ko","yue"`

`-d` - `推理设备, "cuda","cpu"`
`-a` - `绑定地址, 默认"127.0.0.1"`
`-p` - `绑定端口, 默认9880, 可在 config.py 中指定`
`-fp` - `覆盖 config.py 使用全精度`
`-hp` - `覆盖 config.py 使用半精度`
`-sm` - `流式返回模式, 默认不启用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音频编码格式, 流式默认ogg, 非流式默认wav, "wav", "ogg", "aac"`
·-cp` - `文本切分符号设定, 默认为空, 以",.,。"字符串的方式传入`

`-hb` - `cnhubert路径`
`-b` - `bert路径`

大家可以根据需要自行选择。

默认情况下API会启动在9880端口,我们可以使用下面的命令来测试API的启动效果:

使用执行参数指定的参考音频:
GET:
    `http://127.0.0.1:9880?text=先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。&text_language=zh`
POST:
```json
{
    "text": "先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。",
    "text_language": "zh"
}
```

配置MoneyPrinterPlus

好了,回到我们的MoneyPrinterPlus页面。

在基本配置页面,本地语音TTS,我们选择GPTSoVITS, 然后输入GPTSoVITS的地址。

image-20240814105434708

在AI视频或者视频混剪区,在视频TTS语音合成区,我们选择本地服务。

image-20240814002245394

这里列出来GPTsoVITS所需要的大部分参数。

你可以使用参考音频,参考音频文本,参考音频语音。

然后可以条件temperature,top_P, top_K等信息。

image-20240814002312805

点击试听声音,如果你听到合成的声音,那么恭喜你,你的配置成功了。

同时,在GPTsoVITS服务的日志文件中,你可以看到一些语音合成的进度。

image-20240814001906393

总结

GPTsoVITS是一个非常强大的服务,和MoneyPrinterPlus结合起来使用,你将会无往不利。
点我查看更多精彩内容:www.flydean.com

### GPT-SoVits V2 使用教程概述 GPT-SoVits 是一种基于深度学习的个性化音频生成技术,能够通过少量样本训练出特定音色的声音合成模型。以下是有关 GPT-SoVits V2 的使用教程和技术细节。 #### 数据准备 为了训练一个个性化的音色模型,需要准备高质量的语音数据集并按指定结构存储。具体来说,需将所有用于训练的数据存放在 `Data` 文件夹中,并遵循模板定义的目录结构[^1]。这一步骤对于确保模型的有效性和准确性至关重要。 #### 训练过程 完成数据准备工作后,可以启动训练流程来构建专属的音色模型。此阶段涉及复杂的神经网络调整以及参数优化操作,通常依赖于高性能计算资源支持。 #### API 调用说明 当模型训练完成后,可以通过 RESTful API 接口实现在线服务化部署。例如,在本地环境中运行的服务可通过如下 URL 进行访问: ```plaintext http://127.0.0.1:9880/tts?text=一二三四五六七八九零&text_lang=zh&ref_audio_path=./output/slicer_opt/新录音 55.wav.reformatted_vocals.wav_0000039680_0000168640_00_00.wav&prompt_lang=zh&prompt_text=一二三四五六七八九零.&text_split_method=cut2&batch_size=1&media_type=wav&streaming_mode=true ``` 上述请求包含了多个必要参数,其中 `ref_audio_path` 定义了参考音频的具体位置;而其他字段则分别控制输入文本的语言种类、分词方法等属性设置[^2]。 #### Python 示例代码 下面提供了一段简单的 Python 请求示例,展示如何利用 requests 库向该接口发送 POST 请求获取合成后的音频流。 ```python import requests url = 'http://127.0.0.1:9880/tts' params = { 'text': '你好世界', 'text_lang': 'zh', 'ref_audio_path': './output/slicer_opt/sample.wav', 'prompt_lang': 'zh', 'prompt_text': '你好世界.', 'text_split_method': 'cut2', 'batch_size': 1, 'media_type': 'wav', 'streaming_mode': True } response = requests.get(url, params=params) if response.status_code == 200: with open('output.wav', 'wb') as f: f.write(response.content) else: print(f'Error occurred: {response.text}') ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

flydean程序那些事

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值