博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
人工智能
阅读量:6200 次
发布时间:2019-06-21

本文共 3844 字,大约阅读时间需要 12 分钟。

一.关于使用百度的接口

首先需要下载sdk环境配置

pip install baidu-aip

1.进入百度ai开放平台,创建一个语音合成,读取SDK文件文档

from aip import AipSpeech""" 你的 APPID AK SK """APP_ID = '你的 App ID'API_KEY = '你的 Api Key'SECRET_KEY = '你的 Secret Key'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

 

result  = client.synthesis('你好百度', 'zh', 1, {    'vol': 5,})# 识别正确返回语音二进制 错误则返回dict 参照下面错误码if not isinstance(result, dict):    with open('auido.mp3', 'wb') as f:        f.write(result)

 

from aip import AipSpeech""" 你的 APPID AK SK """APP_ID = '15420917'API_KEY = 'eP25XkG4vhdRQk7A6ZW3Zf2C'SECRET_KEY = 'RxwrVkWUodowcBWcyLwS7DWI8B9XE4cH 'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)result = client.synthesis('一人饮酒醉','zh',1,{    'vol':5,})if not isinstance(result,dict):    with open("aduio.mp3","wb") as f:        f.write(result)

 

这样简单的语音合成就实现了

2.语音识别

同上

1.进入百度ai开放平台,创建一个语音合成,读取SDK文件文档

from aip import AipSpeech""" 你的 APPID AK SK """APP_ID = '你的 App ID'API_KEY = '你的 Api Key'SECRET_KEY = '你的 Secret Key'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 读取文件def get_file_content(filePath):    with open(filePath, 'rb') as fp:        return fp.read()# 识别本地文件client.asr(get_file_content('audio.pcm'), 'pcm', 16000, {    'dev_pid': 1536,})

注意:这里识别的文件格式最好是pcm格式,所以使用 前提下载FFmpep 放到环境变量中后,重启pycharm

os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")  #os.system(commind)这里面使用终端命令 进行在线文件格式转换,成pcm格式
from aip import AipSpeechimport os""" 你的 APPID AK SK """APP_ID = '15420917'API_KEY = 'eP25XkG4vhdRQk7A6ZW3Zf2C'SECRET_KEY = 'RxwrVkWUodowcBWcyLwS7DWI8B9XE4cH 'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件def get_file_content(filePath):    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")    with open(f"{filePath}.pcm", 'rb') as fp:        return fp.read()# 识别本地文件res=client.asr(get_file_content('ots.m4a'), 'pcm', 16000, {    'dev_pid': 1536,})print(res)print(res.get("result")[0])

3.进行语音合成与语音语音识别

from aip import AipSpeechimport time,os""" 你的 APPID AK SK """APP_ID = '15420336'API_KEY = 'VwSGcqqwsCl282LGKnFwHDIA'SECRET_KEY = 'h4oL6Y9yRuvmD0oSdQGQZchNcix4TF5P'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件def get_file_content(filePath):    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")    with open(f"{filePath}.pcm", 'rb') as fp:        return fp.read()def audio2text(filepath):    # 识别本地文件    res = client.asr(get_file_content(filepath), 'pcm', 16000, {        'dev_pid': 1536,    })    print(res.get("result")[0])    return res.get("result")[0]def text2audio(text):    filename = f"{time.time()}.mp3"    result = client.synthesis(text, 'zh', 1, {        'vol': 5,        "spd": 3,        "pit": 7,        "per": 4    })    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码    if not isinstance(result, dict):        with open(filename, 'wb') as f:            f.write(result)    return filenametext = audio2text("wyn.wma")filename = text2audio(text)os.system(filename)

 

 

4.图灵智能语音 

作用:通过庞大的数据库进行对话

1.创建一个图灵智能语音,获取api

 

2.查看使用文档

 

接口地址 发送post请求

3.使用实例

{    "reqType":0,    "perception": {        "inputText": {            "text": "附近的酒店"        },        "inputImage": {            "url": "imageUrl"        },        "selfInfo": {            "location": {                "city": "北京",                "province": "北京",                "street": "信息路"            }        }    },    "userInfo": {        "apiKey": "",        "userId": ""    }}

 

代码;

import requestsargs = {    "reqType":0,    "perception": {        "inputText": {            "text": "北京"        }    },    "userInfo": {        "apiKey": "9a9a026e2eb64ed6b006ad99d27f6b9e",        "userId": "1111"    }}url = "http://openapi.tuling123.com/openapi/api/v2"res = requests.post(url,json=args)text = res.json().get("results")[0].get("values").get("text")

 

转载于:https://www.cnblogs.com/zhangqing979797/p/10274102.html

你可能感兴趣的文章
异常抛出增强使用方法及案例
查看>>
MyBatis的接口层(一)
查看>>
一体化建模仿真平台20-sim v4.6.3发布丨附下载
查看>>
Visual Studio 2017 v15.5预览版的新特性先睹为快
查看>>
干货!9种高性能可用高并发的技术架构
查看>>
Elasticsearch PHP MYSQL的同步使用
查看>>
关于生成二维码导致显示不出来 vivo手机出现问题解决办法
查看>>
模拟光链路 动态范围
查看>>
20天时间,一个人怎么搞定这个后台管理项目
查看>>
go并发基础数据加锁解锁
查看>>
6-SpringIOC原理
查看>>
北大教授邱泽奇:农村电商,为什么是菏泽?
查看>>
黄仁勋打响CES第一枪:全球最强芯DRIVE Xavier武装自动驾驶
查看>>
Tengine TLSv1.3最佳实践
查看>>
利用redis缓存对 list集合中的数据 进行分页操作
查看>>
云效(原RDC)如何构建一个基于Maven的Java项目
查看>>
RabbitMQ消息反序列化失败问题回顾
查看>>
Oracle 中实现查找树形结构节点功能
查看>>
aliyun 搭建redis集群
查看>>
java算法-二维极点算法
查看>>