ChatTTS-Forge 是一个基于 ChatTTS 模型开发的强大语音合成项目,它提供了 API 服务器和基于 Gradio 的 WebUI,为用户带来了丰富的功能和便捷的使用体验。本文将详细介绍 ChatTTS-Forge 的主要特性、使用方法以及应用场景。
主要特性
-
多平台支持:提供在线体验、一键启动、容器部署和本地部署等多种使用方式。
-
强大的 WebUI 功能:
- 支持 ChatTTS 模型原生的 Refiner/Generate 功能
- 原生 Batch 合成,高效处理超长文本
- 风格化控制
- SSML 支持,包括编辑器、分割器和播客脚本创建
- 丰富的说话人(Speaker)功能
- Prompt Slot 和文本标准化
- 音质增强和降噪
- 实验性功能如微调和 ASR
-
API 服务器:提供独立的 API 服务,方便与其他应用集成。
-
灵活的 GPU 资源利用:根据不同的配置和需求,可以在不同规格的 GPU 上运行。
-
多角色多情感合成:支持在一段文本中实现多个角色和情感的切换。
-
长文本生成