speex语音增强（去噪）算法简介

最新推荐文章于 2025-06-07 15:13:13 发布

尚若水

最新推荐文章于 2025-06-07 15:13:13 发布

阅读量5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：语音增强文章标签：算法 api

本文链接：https://blog.csdn.net/qq_27728525/article/details/52979937

本文介绍了开源免费的Speex语音增强算法，包括预处理、噪声能量更新、信噪比计算等关键步骤，特别关注了EM算法在增益计算中的应用，适合对语音处理感兴趣的读者。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

speex的语音增强(去噪)算法介绍

speex是一套主要针对语音的开源免费，无专利保护的应用集合，它不仅包括编解码器，还包括VAD(语音检测), DTX(不连续传输),AEC(回声消除),NS(去噪)等实用模块。Speex的增强(去噪)算法性能较好，而一般文档都是侧重于
对应用接口(API)的介绍。本文对speex去噪算法步骤做一些简要整理和介绍，以提供给对该算法感兴趣的读者参考。
1. preprocess_analysis()包括两部分，主要是加窗交叠傅立叶(fft)变换等常用的信号处理算法。
1.1 预处理
信号输入，加窗，交叠(overlap)，时频傅立叶变换（fft）（加窗，分帧，fft）
1.2 计算能量
计算频域能量ps，而filterbnak_compute_bank32()计算基于Bark带(临界频带)内的带噪信号能量。
2. update_noise_prob()更新噪声能量，使用的方法比较简单，即一般的固定迭代因子平滑算法；
3. 更新mel噪声谱能量；
4. 计算后验信噪比和进行先验信噪比更新：
post_SNR = ps/noise - 1；
gamma = 0.1 + 0.89*(old/(old+noise))^2;
priori_SNR= gamma*max(0,post) + (1-gamma)*old_ps/noise;
5. 先验信噪比平滑(zeta[i])，用于本底增益计算,计算范围包括fft域和Bark域。
6 . 计算Bark带(临界频带)内的EM算法增益和线性频域上的EM算法增益。
｛注：EM（YARIV EPHRAIM 和 DAVID MALAH）是语音增强领域的泰斗。｝
考虑到在临界频带内幅度谱并不一定符合高斯随机分布，所以EM算法在Bark带内不能严格适用，这一点JEAN-MARC也