Praat脚本-033 | Praat脚本批量提取MFCC参数

原创已于 2022-03-14 19:17:24 修改 · 5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语音识别 #人工智能

于 2022-03-13 17:11:07 首次发布

Praat 专栏收录该内容

55 篇文章

订阅专栏

MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如：对于一帧有512维(采样点)数据，经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了降维的目的。【原文链接：https://blog.csdn.net/fengzhonghen/article/details/51722555】

有兴趣的朋友可以百度一下相关的更多的介绍。后续本站也会再陆续发表如何使用Python提取，以及它在语音识别、语音分类的一些应用点的例子，欢迎大家讨论关注。

提取数据

这个脚本在git目录里的第33个脚本。33-MFCC_by_Praat_script\Get_MFCC.Praat

Praat运行脚本，Praat->Open Script->Get_MFCC.Praat

第一个输入：就是你的WAV所在的目录，这里是wavs/；
第二个输入：就是你需要转化后的MFCC保存的目录，这里是MFCC/；

最终运行之后可以得到转化后的MFCC文件。

这里说明一下：

本站之前发布的大多数脚本都是采用的相对路径，即textgrids/这样，没有将哪个盘，哪个目录都列出来，这是因为这些目录本身就在和脚本同样的目录下，这是完全没有问题的，经常在咨询群里看到有一些同学自己并不熟悉路径，总是弄错路径，其实我提到过多次了，你就不要动我现在设置的路径，将你的数据放在我的目录里运行就可以了。

获取脚本

https://github.com/feelins/Praat_Scripts

本站所有Praat脚本都可以在上述github的项目目录里找到，如果日常对代码、脚本操作比较熟练的可通过下载、安装、配置github for windows在自己的电脑上通过git clone将代码下载到本机，这样的好处是可以跟主站及时更新代码。
不想费如此脑筋，可以通过点击如下图Code位置所示，下载整站的代码，可直接使用。
在这里插入图片描述

关注

公众号：极地语音工作室, QQ讨论群720939827
在这里插入图片描述

版权说明

1、版权归本博客作者所有；

2、未经本站或者作者允许，不得任意转载本文内容，否则将视为侵权；

3、转载或者引用本文内容请注明来源及原作者；

4、对于不遵守此声明或者其他违法使用本站内容者，本人依法保留追究权等。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

极地语音工作室 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。