帖子

【求助】离线**识别有没办法可以更快识别结束

[复制链接]

该用户从未签到

663 139****6490 发表于 2020-11-17 15:27:54 1#
本帖最后由 139****6490 于 2020-11-17 16:01 编辑

目前离线**的demo可以通过麦克风说话来识别。但是每次识别耗时都比较长,特别是我只说了“向上”,他要过很久才会有结果。
是否有办法实时获得结果(以降低一次判断的时长)
已经按照文档修改了QISRSessionBegin的参数,增加VOD的参数,但没有效果

19F7AD85-F6DA-4f8f-BE0A-DEED35230D3D.png

0C786313-824A-4f4c-AABE-6A8122DBF386.png

其实这个方法并不是我想要的,我想要的是,比如我要说“向左走现在开始”。我离线语义定义成3个部分“向左”、“现在”、“开始”;
当我说“向左”之后立马可以通过QISRGetResult拿到一次结果,之后说到“向左现在”,又能立马拿到一次结果,哪怕这次结果比分很低也没关系。
这样我说完”向左现在开始"不用等到2秒之后结束才能识别,而是立马就能识别到了


小七 发表于 6 天前
2#
离线命令词识别的结果是一次性返回的无法分多次返回,可以设置音频输入结束按钮加快识别速度。

楼内回复

按照文档要求,修改了QISRSessionBegin中VAD相关的参数,vad_eos=10000(防止改成1秒变化太小感官不明显,所以故意改大,想看看是否有效果) 尾部静音的最长时间默认2秒,我改成10秒,但实际测试下来还是2秒,这是  详情 发表于 5 天前
使用道具 举报 回复
139****6490 发表于 5 天前
3#
小七 发表于 2020-11-19 18:58
离线命令词识别的结果是一次性返回的无法分多次返回,可以设置音频输入结束按钮加快识别速度。
...


按照文档要求,修改了QISRSessionBegin中VAD相关的参数,vad_eos=10000(防止改成1秒变化太小感官不明显,所以故意改大,想看看是否有效果)
尾部静音的最长时间默认2秒,我改成10秒,但实际测试下来还是2秒,这是为什么?
使用道具 举报 回复
小七 发表于 5 天前
4#
离线服务vad的值是默认的,是不支持修改的。
使用道具 举报 回复