thchs30的初步操作(一)

这篇博客介绍了如何在Kaldi中处理THCHS30语料库。首先从指定网址下载THCHS30,将其解压缩到kaldi的相应目录下。解压过程中需要注意.gz和.tar文件的不同处理方式。接着,调整egs/thchs30/s5下的path.sh和run.sh脚本,以适应本地运行。在cmd.sh中,将`train_cmd`、`decode_cmd`等接口改为`run.pl`。最后,修改run.sh中的THCHS30路径,以便正确引用解压后的语料库。

thchs30的语料下载地址:
http://www.openslr.org/18/

语料库的准备

首先,下载好语料压缩包后,我们将压缩包放到kaldi的esg/s5/thchs30中
在chchs30中创建一个文件夹叫做thchs30-openslr,然后通过指令来解压三个语料库:
具体操作步骤如下:

1.在官网上下载thchs30语料库(http://www.openslr.org/18/)
下载三个压缩包
2.下载的三个语料库将其放到kaldi中esg/s5/thchs30中三个语料压缩包,三个解压缩包为tar文件

我们注意,在这里的解压最好是在kaldi上用解压指令完成,
解压.gz文件:*.gz 用 gzip -d或者gunzip 解压
解压tar文件指令:tar -xvf file.tar

提醒一下,这里我第一次在这里解压的时候,解压不了这个tar,大家记得将.gz解压后得到的tar文件加上后缀再使用:tar -xvf file.tar来解压。

下面这个网站是一些文件的解压指令:脚本之家

在我们准备好这些前期步骤后,我们就可以去调试egs/thchs30/s5下的path.sh和run.sh脚本了,这个大家也可以参考我跑timit实例的前期步骤,我将博文链接到这:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值