通常的声纹识别研究相关模型包含:预处理、特征提取、建模选择和评分决策。整个过程分为两大步骤,训练和识别。训练是通过对说话人注册来提取语音特征进而建立说话人声纹模版库,测试识别是将待测试语音的模版参数与声纹库中的声纹模版进行比对识别。
- 数据准备(数据集的选取、音频信噪比、截幅检测)
- 预处理(预加重、分帧加窗和语音端点检测)
- 特征提取(语谱图、MFCC)
- 建模选择(模型和损失函数)
- 评分决策(PLDA、cos)
持续补充中…
通常的声纹识别研究相关模型包含:预处理、特征提取、建模选择和评分决策。整个过程分为两大步骤,训练和识别。训练是通过对说话人注册来提取语音特征进而建立说话人声纹模版库,测试识别是将待测试语音的模版参数与声纹库中的声纹模版进行比对识别。
持续补充中…