> 文档中心 > 保姆级kaldi语音识别(2)Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

保姆级kaldi语音识别(2)Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

保姆级Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

  • 前言
  • 一. kaldi准备--虚拟机准备
  • 二. kaldi配置库安装
    • 2.1 常用工具库安装
    • 2.2 kaldi源码下载
    • 2.3 检测依赖库安装
  • 三. kaldi例程实验
    • 3.1 编译tools
    • 3.2 编译src
    • 3.3 跑yesno例子来验证
  • 四. 小结

前言

Kaldi是当前最流行的开源的语音识别工具包,旨在提供灵活且可扩展的组件,包括多种语音信号处理,语音识别,声纹识别和深度神经网络。Kaldi的代码主要用C++编写,在此之上使用bash 和python脚本做了一些工具。目前,主要由语音大佬 Daniel Povey 带领的团队在github上进行开发和维护。

好消息是:2019年10月,Daniel博士正式加入小米公司,担任小米集团语音首席科学家,主要工作就是带领团队开发新一代Kaldi。下面是大佬的弟子,以及大佬来华之后的一些新闻视频,大家可以了解一下。

Kaldi团队日常都会做些什么?在Dan下做事或着和Dan合作做事,都是个怎样的体验?

Kaldi之父:新一代子项目布局基本完成,打造语音识别框架基石

语音识别大神Daniel Povey在小米开发新一代Kaldi

话不多说,开干!

一. kaldi准备–虚拟机准备

第一步打开虚拟机(我的Ubuntu是搭载在虚拟机上的,关于Windows下如何搭建虚拟机环境安装Ubuntu可以查看我的专栏文章:win7下配置虚拟机-安装Ubuntu20.4)
在这里插入图片描述

第二步登录Ubuntu,点击用户名,输入密码
在这里插入图片描述
在这里插入图片描述

第三步进入终端(右键选择“在终端打开”点击进入)
在这里插入图片描述

第四步 输入:

cd /

在这里插入图片描述
进入根目录
在这里插入图片描述

二. kaldi配置库安装

2.1 常用工具库安装

sudo apt-get updatesudo apt-get upgradesudo apt-get install gitsudo apt-get install bcsudo apt-get install g++sudo apt-get install zlib1g-dev make automake autoconf bzip2 libtool subversionsudo apt-get install libatlas3-base

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 kaldi源码下载

第一步下载kaldi,目前kaldi最新版本的代码都是在github(早期的老版本是在svn)

sudo git clone https://github.com/kaldi-asr/kaldi.gitcd kaldi/tools

在这里插入图片描述
在这里插入图片描述

2.3 检测依赖库安装

用kaldi自带的脚本check_dependencies.sh来检测是否安装完所有必须的依赖工具

extras/check_dependencies.sh

在这里插入图片描述
缺什么就安装什么
在这里插入图片描述
在这里插入图片描述
再检查一遍
在这里插入图片描述
根据提示,安装mkl库(这个库很关键)
在这里插入图片描述
再检查一遍
在这里插入图片描述
配置库全部安装完毕!例程走起

三. kaldi例程实验

3.1 编译tools

依赖安装成功,说明编译所需的工具和环境都配置好了,接下来就可以编译tools。

sudo make -j 8

在这里插入图片描述
报错,网上搜了一下应该是openfst没安装好
在这里插入图片描述
直接进入openfst文件夹进行配置安装(注意不是进入openfst文件夹)

cd openfst-1.7.2/

在这里插入图片描述
运行配置文件configure,再make 一遍

sudo ./configure

在这里插入图片描述
回到tools目录(cd …),再make一遍openfst

sudo make openfst

在这里插入图片描述
安装完毕,编译tools

sudo make -j 4

在这里插入图片描述
编译结束
在这里插入图片描述

3.2 编译src

tools编译成功后,就可以到src目录下,编译src

sudo ./configure --shared

在这里插入图片描述

sudo make depend -j 

在这里插入图片描述

sudo make -j 1

在这里插入图片描述
要等一段时间
在这里插入图片描述
编译成功!

3.3 跑yesno例子来验证

进入yesno目录下,kaldi/egs/yesno运行自带的yesno例子,跑./run.sh即可运行

cd ..cd egs/yesno/s5

在这里插入图片描述
跑起来

sudo ./run.sh

在这里插入图片描述
没有报错,
在这里插入图片描述
看到最后一行,恭喜你例程跑通!搞定!

四. 小结

这是kaldi初学者都会经历的配置的步骤,大同小异,看到报错的话不要紧张,根据提示把缺失的库安装上来,确实需要花点时间,但并不难,一步一步来,kaldi环境也就搭起来了,下一步的话,会考虑跑一些其他的例程,或者训练一个自己的语音模型,后续再继续分享。

本次安装配置主要参考:kaldi的编译安装与报错解决方法