mic=ihm:基于独立耳机麦克风的各种语聊和模型
mic=sdm:基于单程麦克风的各种语聊和模型
mic=mdm:基于多程麦克风的各种语聊和模型
data_sp:数据集经过了速度变换(utils/data/perturb_data_dir_speed_3way.sh)
data_hires:数据集经过了音量变换(utils/data/perturb_data_dir_volume.sh)
***.vad:数据集经过了vad算法处理,把闲时噪音(阶段)去掉,只保留说话时候的音段
raw:表示神经网络使用的为13维的MFCC原始特征(没有经过一阶差分,二阶差分)