帖子

【官方】语音转写产品问题解答汇总(持续更新)

[复制链接]

该用户从未签到

1600711  楼主| 小盒子 发表于 2017-2-15 17:51:03 1#
本帖最后由 小盒子 于 2017-2-17 11:21 编辑

在语音转写上线不到两个月的时间里,转写小组收到了很多意见和反馈,非常感谢大家的关注与支持!
关于语音转写产品的所有信息都可以在 转写产品详情页 找到相关资料或者链接。
本版块专属用于语音转写的相关技术交流和通知发布,并且会定期发布大家的问题解答汇总,也欢迎大家踊跃发帖。

最近,转写小组总结&解答了一些大家比较关注的问题,并且首次公布了部分后续的版本计划,希望可以帮助到大家~
1、 同音字识别
由于转写支持上传的是长段音频,所以转写引擎可以结合音频上下文的语义,最佳匹配成跟此音频语义语境最相近的词。也就是说,上传的音频越长,识别率会越高。

2、 关于用户的个性化专有词的识别
因为现在的转写模型为通用模型,对于一些特殊领域专有词以及用户的个性化词转写引擎会识别成常见词。针对这个情况,我们会在后续版本推出可以供用户自定义上传文本语料的接口,更大程度地支持更个性化的识别。

3、关 键 词 鉴别
现有版本下,需要您自行将文本结果进行搜索匹配。后续版本会上线输出多候选词,并且推出 关 键 词检索功能。

4、大音频上传速度问题
由于更高的码流率可以给您带来更高的识别率,但是同时也必须要耗费更多传输的时间。在保证音频识别率的基础上,如果您有大量的并且音频文件比较大的转写任务,为了让您更快速地上传音频文件,可以采用:
(1)上传音频和获取结果请避开语音云的高峰期18:00~24:00。
(2)在音频码流率比较高造成的音频文件比较大的情况下,建议使用opus和flac格式,后期会支持压缩比更高的speex格式。

另外插播一条重要通知:
为了保证大家的数据安全,转写小组最新发布的V1.1.0001.0版本全面支持https,请大家尽快在语音转写产品页http://www.xfyun.cn/services/lfasr下载并更换最新的jar包,我们将在3月15日停止支持旧版http请求。


欢迎大家在本版块交流沟通,转写小组成员会及时为大家解答,好的意见或建议请赶紧砸过来吧!
abc360hz 发表于 2017-2-23 16:31:46
2#
我下载的是 Java_LongFormASR_1.0.0001.0 版本的 SDK
填入我的 appid 和 secret key 后,上传文件拿到 taskid,但是在获取结果的时候得到却是『{"failed":"未购买服务或服务受限","ok":-1}

我已经领取了免费的 电话专用版的套餐,但是提示我没有购买服务。

难道是和企业认证正在审核中有关系吗?
还是说科大续费的服务器有点问题?

代码我反复查验过 我用的type 是 LFASR_TELEPHONY_RECORDED_AUDIO 没错。



楼内回复

我想我知道为什么了。上传也是需要区分 Type 的我第一次上传的 type 是 普通版的LFASR_STANDARD_RECORDED_AUDIO。 改成 LFASR_TELEPHONY_RECORDED_AUDIO 重新 upload 就好了 现在已经好了。  详情 发表于 2017-2-23 16:41
使用道具 举报 回复
abc360hz 发表于 2017-2-23 16:41:44
3#
abc360hz 发表于 2017-2-23 16:31
我下载的是 Java_LongFormASR_1.0.0001.0 版本的 SDK
填入我的 appid 和 secret key 后,上传文件拿到 tas ...

我想我知道为什么了。上传也是需要区分 Type 的我第一次上传的 type 是 普通版的LFASR_STANDARD_RECORDED_AUDIO。
改成 LFASR_TELEPHONY_RECORDED_AUDIO 重新 upload 就好了
现在已经好了。
使用道具 举报 回复
wuyi919 发表于 2017-3-1 17:29:08
4#
我开始使用 转写服务,TASKID
ffa4a9f6440c4d20af26f297fa050bcb
878bc0b67692480b8151****0298ec9c

一直都在 任务正在处理中,请稍后获取结果!已经好几个小时了,还没结果
为啥效率这么慢?
音频提取如下
1488360379(1).jpg


楼内回复

不好意思,如果某段时间用户进行大量的音频上传转写操作的话,可能会存在暂时性的服务拥堵  详情 发表于 2017-3-13 14:48
使用道具 举报 回复
 楼主| 小盒子 发表于 2017-3-13 14:47:06
5#
fans2017 发表于 2017-3-13 11:49
你好,语音转写功能的SDK支持移动终端开发吗?有没有脱机的方式,在不联网的情况下实现该功能?有没有这样 ...

不好意思,都为暂不支持
使用道具 举报 回复
 楼主| 小盒子 发表于 2017-3-13 14:48:58
6#
wuyi919 发表于 2017-3-1 17:29
我开始使用 转写服务,TASKID
ffa4a9f6440c4d20af26f297fa050bcb
878bc0b67692480b8151****0298ec9c

不好意思,如果某段时间用户进行大量的音频上传转写操作的话,可能会存在暂时性的服务拥堵
使用道具 举报 回复
bytdbhy 发表于 2017-3-14 10:27:40
7#
开发环境 SCALA+IDEA+最新语音转写jar包
第一次成功,获取taskid,并成功获取转写后的文本。
第二次失败,程序无修改,上传失败。
从结果分析来看,建联成功,但是上传失败,能够获得上传失败的返回值,跟log4j的警告无关。
求帮助解决。

1.jpg
2.jpg

楼内回复

同问,我刚好也出现这问题了  详情 发表于 2017-3-14 11:06
使用道具 举报 回复
旅行者yky 发表于 2017-3-14 11:06:27
8#

同问,我刚好也出现这问题了
使用道具 举报 回复
ahaoahck 发表于 2017-3-15 11:35:14 来自手机
9#
为什么电话专版的阿拉伯数字识别不完整。如果识别不完整是否有规律
使用道具 举报 回复
ahaoahck 发表于 2017-3-15 11:35:18 来自手机
10#
为什么电话专版的阿拉伯数字识别不完整。如果识别不完整是否有规律
使用道具 举报 回复