帖子

《A.I.开发者大赛专题学习》学习笔记分享园地 | 讯飞AI大学

  [复制链接]
133****2471 发表于 2020-8-12 16:25:16
51#
# Day19学习笔记 08/12 23.png

1)Speechutilityi初始化
2Speechrecognizert初始化
3)Speechrecognizen识别参数设置
4)Speechrecognizer. startlistening开始识别
5)Recognizerlistenerk监听识别过程


使用道具 举报 回复
153****8260 发表于 2020-8-12 16:52:13
52#
# Day1 学习笔记 8/12
## WebAI接口详解
### http
* 无法多次返回值
### 动态修正
* 时间快
* 有修正的感觉,很智能
* 加入动态修正不会提高识别率,只是会把中间的结果返回。

使用道具 举报 回复
153****8260 发表于 2020-8-12 17:35:43
53#
day12 学习笔记 0812_1.jpg
使用道具 举报 回复
Supriya孙英 发表于 2020-8-12 23:00:13
54#
#Day02+学习笔记+08/12
Day02.png
使用道具 举报 回复
133****2471 发表于 2020-8-13 18:43:36
55#
# Day20学习笔记 08/13## 特性

IP白名单-你的安全小卫士
动态修正-吸引用户的利器
静音检测-用户的小棉祆
Domain应用和pd个性-不可错过的个性化

## 步骤
1.控制台默取 appid, alike, apisecret
2.生成鉴权链接ur1
3.实时发送业务参数和base64编码的音频数据
4.接收服务端结果并解析### 重要
sid 查询汇话

### 动态修正
fin = ''
rpl = ''
if 'pwg' == 'apd':
    fin = fin + apl
pwg == rpl:
fin+当前识别结果

使用道具 举报 回复
153****8260 发表于 2020-8-13 21:11:21
56#
# day3 学习笔记
# 主题:语音听写WebAPI接口的常见问题
## framesize、采样率等参数
* frame为每次读取的音频的大小
* frame写1280,原因如下:
音频由采样率和采样精度所标识
16k 16bit pcm 未压缩音频
采样率:每秒采集音频的次数
采样精度:每秒采集音频的位数
1b = 8bit
1s = 40ms * 25
40ms      16000*16/25  * 8 = 1280

使用道具 举报 回复
153****8260 发表于 2020-8-14 15:49:21
57#

QQ图片20200814154346.jpg
使用道具 举报 回复
133****2471 发表于 2020-8-14 23:00:57
58#
# Day21学习笔记 08/14## 特性


# 采样率
每秒从连续信号中提取并组成离散信号的采样个数,
它用赫兹(Hz)来表示,比如160008000Hz
采样率过低,会信号失真;采样率过高,会浪费资源。
# 量化精度
>取得采样值后,要对数据进行量化,就是把各个时
刻的采样值用计算机能识别的二进制来表示
>以位(bit)为单位,比如8位、16位。


## 音频格式:PCM
PCM(数据裸流)
未压缩的原始音频数据
音频质量高
网络传输带要求高
一般的播放器不可直接播放
Cool Edit Pro
可直接播放
事先指定采样率等属性

PCM比特率(bps)=采样率*量化精度
注:每秒传送的比特(bit)数

音频大小(Byte)=比特率*音频时长*声道数/8
PCM即:(采样率*量化精度)*音频时长*声道数/8

## 音频格式: Speex

Speex是一套主要针对语音的开源兔费的音频压缩格式,在网络应用上有独特的忧势
主要被设计用于三种不同的采样率:8kHz(窄常,16kHz(宽带节)和32kHz(超带)

使用道具 举报 回复
133****2471 发表于 2020-8-15 11:54:38
59#
# Day22学习笔记 08/15遇到其他格式可以先转换

识别率差
只有前半段,静音时间太长,只有后半段,拼接动态返回结果
结果差太多,音频格式错误,参数错误
热词,增加权重


带音频文件,SID,提交工单

是.png


使用道具 举报 回复
153****8260 发表于 2020-8-15 15:44:22
60#
ECFB3E34-3595-4F99-9C65-8600C7F3BA4B.jpeg
使用道具 举报 回复