google Lyra 中的 RVQ(矢量残差量化)

下面记录一下 Lyra 中 rvq 相关内容,矢量残差量化是小比特率压缩的常用方法。

下面是 lyra 每个模型的输入输出 shape:

-------------------
ModelName:lyragan
 Input 0 => [1, 1, 64]
 Output 0 => [1, 320]
Signature: serving_default
  Signature Input: input_audio => [1, 1, 64]
  Signature Output: output_0 => [1, 320]
-------------------
ModelName:quantizer
Signature: decode
  Signature Input: encoding_indices => [46, 1, 1]
  Signature Output: output_0 => [1, 1, 64]
Signature: encode
  Signature Input: input_frames => [1, 1, 64]
  Signature Input: num_quantizers => []
  Signature Output: output_0 => [46, 1, 1]
  Signature Output: output_1 => []
-------------------
ModelName:soundstream_encoder
 Input 0 => [1, 320]
 Output 0 => [1, 1, 64]
Signature: serving_default
  Signature Input: input_audio => [1, 320]
  Signature Output: output_0 => [1, 1, 64]

总体流程:

音频每帧 20ms 对应 320 个样本,提取 64 维特征向量,Lyra 中最大支持 46 级码本也就是最多 46 个量化器,每个量化器包含 16 个码向量(码索引为 0~15 那么每个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

0x13

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值