python实现语音识别前期准备（调用科大讯飞平台）_科大讯飞人机对话python资源-CSDN下载

103 浏览量 2020-12-21 17:59:58 上传评论 5 收藏 210KB PDF 举报

本demo测试时运行的环境为：Windows + Python3.7 本demo测试成功运行时所安装的第三方库及其版本如下，您可自行逐一或者复制到一个新的txt文件利用pip一次性安装： cffi1.12.3 gevent1.4.0 greenlet0.4.15 pycparser2.19 six1.12.0 websocket0.2.1 websocket-client==0.56.0 语音听写流式 WebAPI 接口调用示例接口文档（必看）：https://doc.xfyun.cn/rest_api/语音听写（流式版）.html webapi 听写服务参考帖子（必看）：http://bb 在本文中，我们将探讨如何使用Python调用科大讯飞平台来实现语音识别。科大讯飞是中国领先的语音技术提供商，提供了丰富的API接口供开发者使用。在这个过程中，我们需要准备一些必要的环境和第三方库，以及了解科大讯飞的语音听写流式WebAPI接口。确保你的开发环境是Windows操作系统，并且已经安装了Python 3.7。为了成功运行语音识别的Demo，你需要安装以下第三方库： 1. cffi 1.12.3 2. gevent 1.4.0 3. greenlet 0.4.15 4. pycparser 2.19 5. six 1.12.0 6. websocket 0.2.1 7. websocket-client 0.56.0 你可以将这些库的版本号复制到一个txt文件中，然后使用pip一次性安装。此外，还需要查阅两个重要的参考资料： 1. 语音听写流式WebAPI接口文档：https://doc.xfyun.cn/rest_api/语音听写（流式版）.html 2. webapi听写服务参考帖子：http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=38947&extra= 在科大讯飞开放平台上，你可以管理你的应用，包括设置个性化热词和选择识别的方言。热词功能可以提高特定词汇的识别概率，但并不保证100%识别正确。同样，你可以添加方言以支持不同地区的语音识别。在实际操作中，语音识别通常涉及以下几个步骤： 1. 准备工作：下载并安装必要的库，创建一个CSV文件存储语音文件及其对应文本。 2. 调用API：使用Python编写代码来与科大讯飞的API交互。这通常涉及到几个关键的接口，如准备、上传、合并和获取结果等。 3. 文件处理：将音频文件分割成合适大小的片段，并使用base64编码，以便通过HTTP请求发送给API。 4. 参数配置：根据需求调整转写参数，如转写类型、是否开启分词、多候选词个数等。 5. 请求与响应：构造HTTP请求，使用API接口进行文件上传、进度查询和结果获取。这通常涉及到对请求头的设置，包括AppID、时间戳、签名等安全验证信息。以下是一个简单的Python代码示例，展示了如何进行非实时转写的调用： ```python # 省略的代码... class RequestApi(object): def __init__(self, appid, secret_key, upload_file_path): self.appid = appid self.secret_key = secret_key self.upload_file_path = upload_file_path # 其他方法（如签名计算、发送请求等）... # 示例用法： appid = 'your_appid' secret_key = 'your_secret_key' upload_file_path = 'path_to_your_audio_file' request_api = RequestApi(appid, secret_key, upload_file_path) # 调用request_api的方法进行后续操作 ``` 在这个示例中，RequestApi类封装了与API交互的逻辑，包括生成签名、构建请求头和发送HTTP请求。你需要替换appid和secret_key为你在科大讯飞开放平台申请的账号信息，upload_file_path为你要识别的音频文件路径。通过Python调用科大讯飞的语音识别API，你可以实现对音频文件的高效转写。这个过程涉及到了环境配置、库的安装、API接口的理解以及Python代码的编写。遵循上述步骤，你将能够成功地集成语音识别功能到你的应用程序中。

资源推荐

资源详情

资源评论

python实现语音识别前期准备（调用科大讯飞平台）实现语音识别前期准备（调用科大讯飞平台）

本demo测试时运行的环境为：Windows + Python3.7

本demo测试成功运行时所安装的第三方库及其版本如下，您可自行逐一或者复制到一个新的txt文件利用pip一次性安装：

cffi1.12.3

gevent1.4.0

greenlet0.4.15

pycparser2.19

six1.12.0

websocket0.2.1

websocket-client==0.56.0

语音听写流式 WebAPI 接口调用示例接口文档（必看）：https://doc.xfyun.cn/rest_api/语音听写（流式版）.html

webapi 听写服务参考帖子（必看）：http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=38947&extra=

语音听写流式WebAPI 服务，热词使用方式：登陆开放平台https://www.xfyun.cn/后，找到控制台–我的应用—语音听写（流式）—服务管理–个性化热词，

设置热词

注意：热词只能在识别的时候会增加热词的识别权重，需要注意的是增加相应词条的识别率，但并不是绝对的，具体效果以您测试为准。

语音听写流式WebAPI 服务，方言试用方法：登陆开放平台https://www.xfyun.cn/后，找到控制台–我的应用—语音听写（流式）—服务管理–识别语种列表

可添加语种或方言，添加后会显示该方言的参数值

错误码链接：https://www.xfyun.cn/document/error-code （code返回错误码时必看）

注释：下载以上这些，我们可以使用清华源下载会比较快.

链接：https://www.cnblogs.com/sky-ai/p/9800036.html

1.装完这些以后，下载demo，本人下载的是语音转写，大家可以在网址中进行选择并下载。

2.在做下面步骤之前，大家可以先看8.（在下方）

3.由于语音识别的文件有多个，我们需要将其转化为与之对应的文本，将其保留在.csv文件中

代码如下：

# -*- coding: utf-8 -*

# 非实时转写调用demo

import base64

import hashlib

import hmac

import json

import os

import time

import csv

import pandas as pd

import requests

#import datetimepi

import json

i=1

lfasr_host = 'http://raasr.xfyun.cn/api'

# 请求的接口名

api_prepare = '/prepare'

api_upload = '/upload'

api_merge = '/merge'

api_get_progress = '/getProgress'

api_get_result = '/getResult'

# 文件分片大小10M

file_piece_sice = 10485760

# ——————————————————转写可配置参数————————————————

# 参数可在官网界面（https://doc.xfyun.cn/rest_api/%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99.html）查看，根据需求可自行在gene_params方法里添加修改

# 转写类型

lfasr_type = 0

# 是否开启分词

has_participle = 'false'

has_seperate = 'true'

# 多候选词个数

max_alternatives = 0

# 子用户标识

suid = ''

class SliceIdGenerator:

"""slice id生成器"""

def __init__(self):

self.__ch = 'aaaaaaaaa`'

def getNextSliceId(self):

ch = self.__ch

j = len(ch) - 1

while j >= 0:

cj = ch[j] if cj != 'z':

ch = ch[:j] + chr(ord(cj) + 1) + ch[j + 1:] break

else:

ch = ch[:j] + 'a' + ch[j + 1:] j = j - 1

self.__ch = ch

return self.__ch

class RequestApi(object):

def __init__(self, appid, secret_key, upload_file_path):

self.appid = appid

self.secret_key = secret_key

self.upload_file_path = upload_file_path

# 根据不同的apiname生成不同的参数,本示例中未使用全部参数您可在官网(https://doc.xfyun.cn/rest_api/%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99.html)查看后选择

适合业务场景的进行更换

def gene_params(self, apiname, taskid=None, slice_id=None):

appid = self.appid

secret_key = self.secret_key

upload_file_path = self.upload_file_path

ts = str(int(time.time()))

m2 = hashlib.md5()

m2.update((appid + ts).encode('utf-8'))

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论收藏

内容反馈