前段时间,分享了低延迟小智AI服务端搭建
的 ASR、LLM 和 TTS 部分:
这三个环节中,成本最高的当属 TTS。
上篇是本地TTS篇
的第一篇:
低延迟小智AI服务端搭建-本地TTS篇:fishspeech流式推理
本篇,实测本地部署的 CosyVoice2.0
,这也是阿里云上提供的云端 tts 采用的模型。
1. 关于 CosyVoice2.0
本地部署 cosyvoice2.0 并搭建音色克隆服务,笔者之前有分享过:阿里开源 CosyVoice 再升级!支持流式输出,本地部署实测,在此不再赘述。
相比 fishspee