帖子

求教:语音听写(流式版)WebAPI速度慢且识别结果少了很.....

[复制链接]

该用户从未签到

7309  楼主| 6262527106 发表于 2019-8-3 15:03:27 1#
1语点
基于另外一位朋友的帖子: 语音听写(流式版)WebAPI C#Demo,把测试文件改成我自己的录音,结果少了很多字

录音见附件

1,正确的文字应为:现在是北美太平洋夏令时间晚19点50分,测试结束。
2,上述C#Demo的结果是:现在是北美太平洋下定时间。

后面的一半的文字都没有了,请帮忙看一下

C#程序主要参数如下:
byte[] ReceiveBuff = new byte[1024];//根据实际情况设置大小
int frameSize = 122 * 8; //每一帧音频的大小,建议每 40ms 发送 122B
int intervel = 10;

common.Add("app_id", x_appid);
business.Add("language", "zh_cn");
business.Add("domain", "iat");
business.Add("accent", "mandarin");
data.Add("status", StatusFirstFrame);
data.Add("format", "audio/L16;rate=16000");
data.Add("audio", Convert.ToBase64String(buffer));
data.Add("encoding", "raw");

音频文件是单通道WAV格式,采样率16000,编码率48000,长度12秒

谢谢

outsample.zip

324.1 KB, 下载次数: 23

小七 发表于 2019-8-5 17:00:11
2#
可以将静默时间设置长一点试试,我测试是正常的

微信图片_20190805165847.png

楼内回复

另外,能不能麻烦您贴一下每次返回的JSON数据,特别是最后一次的,我好像没收到过最后的结束数据 以下是我收到的JSON {"code":0,"message":"success","sid":"iat00075a00@gz16c65ae69123c98802","data":{"result":{  详情 发表于 2019-8-6 14:54
谢谢回复,看来还是我的程序问题,有两个问题请教 1,您指的静默时间是不是intervel,即每个片段发送后的等待时间?您用的是什么值? 2,看起来您的程序返回也要14秒,这是正常速度吗? 3,是不是用语音转写API会更  详情 发表于 2019-8-6 09:58
使用道具 举报 回复
 楼主| 6262527106 发表于 2019-8-6 09:58:39
3#
177****8010 发表于 2019-8-5 17:00
可以将静默时间设置长一点试试,我测试是正常的

谢谢回复,看来还是我的程序问题,有3个问题请教
1,您指的静默时间是不是intervel,即每个片段发送后的等待时间?您用的是什么值?
2,看起来您的程序返回也要14秒,这是正常速度吗?
3,是不是用语音转写API会更快一点?

楼内回复

1.静默时间指的是vad_eos 2.返回的时长受音频长度的影响[/backcolor] 3.你可以测试下,选取效果好的用就行,但他们的区别其实也就是音频长度的限制不同[/backcolor]  详情 发表于 2019-8-6 11:26
使用道具 举报 回复
小七 发表于 2019-8-6 11:26:12
4#
6262527106 发表于 2019-8-6 09:58
谢谢回复,看来还是我的程序问题,有3个问题请教
1,您指的静默时间是不是intervel,即每个片段发送后的等 ...

1.静默时间指的是vad_eos
2.返回的时长受音频长度的影响

3.你可以测试下,选取效果好的用就行,但他们的区别其实也就是音频长度的限制不同

楼内回复

谢谢,是原来C# Demo的写法有问题,我改完就可以拿到全部结果了  详情 发表于 2019-8-6 14:30
使用道具 举报 回复
 楼主| 6262527106 发表于 2019-8-6 14:30:03
5#
177****8010 发表于 2019-8-6 11:26
1.静默时间指的是vad_eos
2.返回的时长受音频长度的影响
3.你可以测试下,选取效果好的用就 ...

谢谢,是原来C# Demo的写法有问题,我改完就可以拿到全部结果了

使用道具 举报 回复
 楼主| 6262527106 发表于 2019-8-6 14:54:02
6#
177****8010 发表于 2019-8-5 17:00
可以将静默时间设置长一点试试,我测试是正常的

另外,能不能麻烦您贴一下每次返回的JSON数据,特别是最后一次的,我好像没收到过最后的结束数据
以下是我收到的JSON
{"code":0,"message":"success","sid":"iat00075a00@gz16c65ae69123c98802","data":{"result":{"bg":0,"ed":0,"ls":false,"sn":1,"ws":[{"bg":50,"cw":[{"sc":0,"w":"现在"}]},{"bg":106,"cw":[{"sc":0,"w":"是"}]},{"bg":130,"cw":[{"sc":0,"w":"北美"}]},{"bg":226,"cw":[{"sc":0,"w":"太平洋"}]},{"bg":310,"cw":[{"sc":0,"w":"下"}]},{"bg":342,"cw":[{"sc":0,"w":"定"}]},{"bg":366,"cw":[{"sc":0,"w":"时间"}]}]},"status":1}}

{"code":0,"message":"success","sid":"iat00075a00@gz16c65ae69123c98802","data":{"result":{"bg":0,"ed":0,"ls":false,"sn":2,"ws":[{"bg":469,"cw":[{"sc":0,"w":","}]},{"bg":469,"cw":[{"sc":0,"w":"晚"}]},{"bg":509,"cw":[{"sc":0,"w":"19:00"}]}]},"status":1}}

{"code":0,"message":"success","sid":"iat00075a00@gz16c65ae69123c98802","data":{"result":{"bg":0,"ed":0,"ls":false,"sn":3,"ws":[{"bg":738,"cw":[{"sc":0,"w":"50分"}]}]},"status":1}}

{"code":0,"message":"success","sid":"iat00075a00@gz16c65ae69123c98802","data":{"result":{"bg":0,"ed":0,"ls":false,"sn":4,"ws":[{"bg":885,"cw":[{"sc":0,"w":","}]},{"bg":885,"cw":[{"sc":0,"w":"测试"}]},{"bg":933,"cw":[{"sc":0,"w":"结束"}]}]},"status":1}}

谢谢


楼内回复

我上面发的就是java所有的返回结果  详情 发表于 2019-8-6 16:37
使用道具 举报 回复
小七 发表于 2019-8-6 16:37:20
7#
6262527106 发表于 2019-8-6 14:54
另外,能不能麻烦您贴一下每次返回的JSON数据,特别是最后一次的,我好像没收到过最后的结束数据
以下是 ...

我上面发的就是java所有的返回结果

楼内回复

好吧,谢谢 我在发送最后一帧后加了个循环用来等待最后的返回值就好了  详情 发表于 2019-8-7 12:33
使用道具 举报 回复
 楼主| 6262527106 发表于 2019-8-7 12:33:45
8#
177****8010 发表于 2019-8-6 16:37
我上面发的就是java所有的返回结果

好吧,谢谢

我在发送最后一帧后加了个循环用来等待最后的返回值就好了


楼内回复

我加上怎么还是不好使呢,麻烦把你的代码贴一下,谢谢!  详情 发表于 2019-8-8 05:12
使用道具 举报 回复
186****0400 发表于 2019-8-8 05:12:21
9#
6262527106 发表于 2019-8-7 12:33
好吧,谢谢

我在发送最后一帧后加了个循环用来等待最后的返回值就好了

我加上怎么还是不好使呢,麻烦把你的代码贴一下,谢谢!
使用道具 举报 回复
m153****2352@16 发表于 2019-8-29 10:17:15
10#
问题解决了吗?我的也是,基本上就是只能读取5秒的音频,多了的不分解析不出来
使用道具 举报 回复