帖子

【官方】语音转写V1.2版本更新说明

[复制链接]

该用户从未签到

35561  楼主| 小盒子 发表于 2017-3-17 16:09:36 1#
本帖最后由 小盒子 于 2017-3-30 13:45 编辑

最新版本上线,敬请各位在语音转写产品页面http://www.xfyun.cn/services/lfasr下载新版SDK体验~~


1、用户访问认证逻辑重构   
        处理了之前因为平台防火墙问题导致的用户“服务认证失败”的现象。并在用户级别设置了访问控制,即一秒可请求的最大认证次数为5次(包括上传音频和下载结果方法),超频(每秒大于或等于5次)即返回26008错误,描述为:“Service certification exceeds frequency limit, please try one minute later.”

2、新增分词形式结果    
在兼容之前版本的基础上增加返回给用户的分词结果。SDK上传接口中添加了获取含分词参数的结果方法,如下
Message lfasr_upload(String localFile, boolean hasParticiple) throws LfasrException
相比lfasr_upload(String localFile)方法,只要再添加一个boolean类型的hasParticiple=true的参数就能获取含有分词参数的结果了(参数hasParticiple缺省时为false,即不输出分词形式结果)
结果返回示例如下:
[mw_shl_code=java,true]{
\"bg\": 1100, //句子相对于本音频的起始时间,单位为ms
\"ed\": 5950, //句子相对于本音频的终止时间,单位为ms
\"nc\": \"1.0\", //句子置信度,范围为[0,1]
\"onebest\": \"唉,老铁,你出门了吧?\",  //句子内容
\"si\": \"1\", //句子位置,从0开始累加
\"speaker\": \"1\",
\"wordsResultList\": [ //分词内容
{
\"wc\": \"1.0\", //词置信度,范围为[0,1]
\"wordBg\": \"37\", //词相对于本句子的起始帧
\"wordEd\": \"130\", //词相对于本句子的终止帧
\"wordsName\": \"唉\",
\"wp\": \"s\" //词属性
},
{
\"wc\": \"0.0\",
\"wordBg\": \"130\",
\"wordEd\": \"130\",
\"wordsName\": \",\",
\"wp\": \"p\"
},
{
\"wc\": \"1.0\",
\"wordBg\": \"130\",
\"wordEd\": \"150\",
\"wordsName\": \"老\",
\"wp\": \"n\"
},
{
\"wc\": \"1.0\",
\"wordBg\": \"150\",
\"wordEd\": \"296\",
\"wordsName\": \"铁\",
\"wp\": \"n\"
},
{
\"wc\": \"0.0\",
\"wordBg\": \"296\",
\"wordEd\": \"296\",
\"wordsName\": \",\",
\"wp\": \"p\"
},
{
\"wc\": \"0.9075\",
\"wordBg\": \"296\",
\"wordEd\": \"330\",
\"wordsName\": \"你\",
\"wp\": \"n\"
},
{
\"wc\": \"1.0\",
\"wordBg\": \"330\",
\"wordEd\": \"359\",
\"wordsName\": \"出门\",
\"wp\": \"n\"
},
{
\"wc\": \"1.0\",
\"wordBg\": \"359\",
\"wordEd\": \"368\",
\"wordsName\": \"了\",
\"wp\": \"n\"
},
{
\"wc\": \"1.0\",
\"wordBg\": \"368\",
\"wordEd\": \"425\",
\"wordsName\": \"吧\",
\"wp\": \"s\"
},
{
\"wc\": \"0.0\",
\"wordBg\": \"425\",
\"wordEd\": \"425\",
\"wordsName\": \"?\",
\"wp\": \"p\"
}
]
}[/mw_shl_code]

其中,
1)分词的在本音频的绝对起始时间=bg+10*wordBg,终止时间以此类推。
2)wp:词属性,目前支持p-标点,s-顺滑词,n-普通词 三种。
3)置信度:分值越大,可信度越高

3、转写状态码和错误码更新   

lfasr_upload上传方法返回字段状态说明如下:
ok =-1      上传失败,返回err_no中的相关错误码并给出failed字段描述
ok =0       上传成功,并输出data中的taskID

lfasr_get_result结果获取方法返回字段状态说明如下:
err_no!=0 && ok =-1      转写失败,并出现“failed”字段描述
err_no   =0 && ok =-1      转写中,并出现“failed”字段描述,请等待一段时间再进行获取
err_no   =0 && ok =0       转写成功

如果出现错误,“err_no”字段参数非零,并出现“failed”字段描述,具体参考如下:
序号
错误码
描述
1
26205
处理失败
2
26001
任务类型错误
3
26002
任务创建失败(请重新尝试)
4
26003
参数非法
5
26004
文件大小超限(现暂定文件上限为100M)
6
26005
文件格式错误(具体格式请参照语音转写产品详情页)
7
26006
文件上传失败(请重新尝试)
8
26007
服务认证失败(请检查您的appid和secret_key)
9
26008
服务认证超频,请一分钟后尝试
10
26101
任务编号不存在
11
26102
获取结果发生错误(请重新尝试)
12
26103
服务受限(请检查您的账户余量)
13
26104
音频时长超过限制(时长上限为5小时)
14
26105
处理失败
15
26099
未知错误
16
26201
任务创建失败
17
26202
任务创建失败
18
26203
任务创建失败
19
26204
任务创建失败

更多详情请参见:http://www.xfyun.cn/doccenter/lfasr#go_sdk_doc
1332407213@qq.c 发表于 2017-4-1 13:32:42
2#
赞赞赞赞赞赞赞赞
使用道具 举报 回复