ubuntu vosk
时间: 2025-02-21 14:26:57 浏览: 84
### 安装和配置 Vosk 语音识别库
#### 准备工作
为了在 Ubuntu 上成功安装并配置 Vosk 语音识别库,需先更新系统的软件包列表以及升级已有的软件包到最新版本[^1]。
```bash
sudo apt update && sudo apt upgrade -y
```
#### 安装依赖项
接着,安装必要的开发工具和其他依赖项来支持 Python 和 pip 的运行环境。这包括编译器、构建工具以及其他可能需要的基础库文件[^2]。
```bash
sudo apt install build-essential cmake git pkg-config python3-dev python3-pip libasound2-plugins ffmpeg -y
```
#### 创建虚拟环境 (可选)
建议创建一个新的 Python 虚拟环境用于隔离项目所需的特定版本的 Python 库,防止与其他项目的依赖冲突。
```bash
python3 -m venv vosk_env
source vosk_env/bin/activate
```
#### 安装 Vosk 及其模型
通过 pip 工具可以方便地安装最新的 Vosk 包。之后下载适合目标语言的大规模声学模型以提高识别准确性。
```bash
pip installvosk==0.3.47 # 或者其他稳定版本号
# 下载中文普通话大模型作为例子
wget https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip
unzip vosk-model-cn-0.22.zip -d vosk-model-cn-0.22
rm vosk-model-cn-0.22.zip
```
#### 测试安装成果
编写简单的测试脚本来验证安装是否成功完成,并尝试加载所下载的语言模型来进行基本的声音输入转文字输出操作。
```python
from vosk import Model, KaldiRecognizer
import sys
import os
import wave
if not os.path.exists("model"):
print ("Please download the model from https://alphacephei.com/vosk/models and unpack as 'model' in the current folder.")
exit (1)
wf = wave.open(sys.argv[1], "rb")
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
print ("Audio file must be WAV format mono PCM.")
exit (1)
model = Model("vosk-model-cn-0.22") # 替换成实际路径下的模型名称
rec = KaldiRecognizer(model, wf.getframerate())
while True:
data = wf.readframes(4000)
if len(data) == 0:
break
if rec.AcceptWaveform(data):
print(rec.Result())
else:
print(rec.PartialResult())
print(rec.FinalResult())
```
保存上述代码至 `test_vosk.py` 文件中并通过命令行执行该程序,提供一个有效的 `.wav` 音频文件作为参数即可看到转换后的文本结果。
阅读全文
相关推荐

















