
kaldi
文章平均质量分 50
落红灬有丶情
nice to meet you~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
kald脚本解释
数据准备译者:V ([email protected]) 水平有限,如有错误请多包涵。 @wbglearn校对。介绍在运行完示例脚本后(见Kaldi tutorial),你可能会想用自己的数据在Kaldi上跑一下。本节主要讲述如何准备相关数据。我们假设本页的读者使用的是最新版本的示例脚本(即在脚本目录下被命名为s5的那些,例如egs/rm/s5)。另外,除了阅读本页所述内容转载 2017-11-20 15:14:37 · 1767 阅读 · 0 评论 -
kaldi中各种代码缩写的意思
mic=ihm:基于独立耳机麦克风的各种语聊和模型mic=sdm:基于单程麦克风的各种语聊和模型mic=mdm:基于多程麦克风的各种语聊和模型data_sp:数据集经过了速度变换(utils/data/perturb_data_dir_speed_3way.sh)data_hires:数据集经过了音量变换(utils/data/perturb_data_dir_volume.sh)...原创 2019-03-07 08:45:02 · 1132 阅读 · 0 评论 -
dnn+i-vector在kaldi中的实现。
需要三行脚本,你可以一行做一个脚本文件,这样就不需要每次提取特征都要重新训练1步骤和2步骤的模型了。1:steps/online/nnet2/train_diag_ubm.sh --cmd "$train_cmd" data/train 1024 exp/tri3exp/diag_ubm#tri3是你训练的三音素模型所在的文件夹2:steps/online/nnet2/train_i...原创 2020-08-11 15:57:02 · 559 阅读 · 1 评论 -
语音识别之语料准备
首先要制定好音频的格式,比如:Mono(单声道),16000hz(采样率),音频格式为wav。接着,录音的时候一定要慢!不要太快,如果太快的话识别率会很低。文本中的字符一定要确定好是utf-8的编码,不然之后会出各种错误。...原创 2018-07-18 16:22:25 · 2802 阅读 · 0 评论 -
kaldi 数据准备错误集
问题1:utils/validate_data_dir.sh: file data/sre/utt2spk is not in sorted order or has duplicates解决方法:解决方法,你可以这样试一下。utils/fix_data_dir.sh data/train #这段代码可以帮你解决问题。在steps/make_mfcc.sh之前加上上面的代码!!...原创 2018-07-16 19:17:33 · 3407 阅读 · 4 评论 -
kaldi mfcc
Kaldi特征提取之-预处理背景本质上语音信号是一维的时间信号,随时间上下波动。现实中,人们再说话时会受到各种音素的干扰,为了进一步进行处理,我们必须进行必要的预处理以便之后的特征提取。诸如FBank,MFCC,PLP等都需要经过预处理步骤。本章将假设语音的格式为wav。预处理整个预处理过程如下图所示:分帧 从图中可以看出我们需要将不定长的音频切分成固定长度的小段,这一步称为分帧。分帧的原因在于语...转载 2018-06-07 14:39:11 · 787 阅读 · 0 评论 -
kaldi 说话人自适应
自适应的作用是,补偿实际数据与已经训练的三音素模型中声学条件不匹配的问题,包括说话人特性(说话方式、口音等)及环境特性(如录音设备、房间混响等)。在GMM-HMM模型中,自适应方法有特征空间变换和模型空间变换。Kaldi中主要采用的是特征空间变换方法: LDA、MLLT和fMLLR,其本质都是在训练过程中估计变换矩阵,然后构造变换后的特征,再迭代训练新的声学模型参数。LDA+MLLT针对环境特性,...转载 2018-06-13 17:32:36 · 1644 阅读 · 0 评论 -
kaldi dnn
1.如果你要跑dnn,那么你的训练数据集必须大于300条,不然会莫名其妙的出错。(这个错花了我1天的时间)2.如果你要用score.sh来对你的 dan's dnn 模型进行解码,那么在执行解码decode.sh之前,你需要cp exp/tri3/trans.1 exp/tri3/decode/ 因为解码脚本需要它,然而之前的脚本没有把这个文件拷贝进去。...原创 2018-05-24 17:50:53 · 753 阅读 · 0 评论 -
timit实例的运行
首先安装ubuntu14.04平台,安装好后就开始安装各种kaldi需要的组件,代开终端,在其中输入如下代码安装前的配置 sudo apt-get install libtool sudo apt-get install autoconf sudo apt-get install wget sudo apt-get install perl sudo apt-转载 2017-12-12 19:55:18 · 1173 阅读 · 0 评论 -
基于kaldi的在线语音识别
本文是基于kaldi的在线语音识别,使用b/s架构进行在线识别。适用于刚刚接触的小白。开发环境:jdk-1.8,Ubuntu16.04,Eclipse。开发过程:1.准备必须的文件 如果你想要实现在线语音识别功能在kaldi下,那么你需要有训练好的“final.mdl”(final.mdl其实是最后模型链接过来的,是最后的模型“数字.mdl”,如果你发现你复制不过来“...原创 2017-12-18 09:58:12 · 5158 阅读 · 12 评论 -
kaldi、kaldi-ctc的安装(CUDA+CUDNN)
操作系统:Ubuntu14.04(64位)显卡:GTX750TiCUDA版本:7.5(后缀为cuda_7.5.18_linux.run)(截止2019-3-1,kaldi仅支持cuda7.5和cuda8.0)CUDNN版本:5.1(cudnn-7.5-linux-x64-v5.1.tgz)(截止2019-3-1,kaldi仅支持cudnn5.1)Nvidia显卡驱动:NVIDIA-...原创 2017-09-24 21:46:23 · 3543 阅读 · 4 评论