帖子

【官网】Windows平台的常见问题

[复制链接]

该用户从未签到

23870  楼主| qwerdrqwe@163.c 发表于 2014-9-17 14:07:06 1#
本帖最后由 xugao2@iflytek. 于 2015-5-8 22:49 编辑

以下是Windows平台上面开发者经常提问的问题,希望这个帖子可以帮助开发者们更加便捷的找到自已所需要的答案。



-----------------------------------------分割线--------------------------------------------------------------------------


Q:传输数据是否要加wav头?直接mic的数据给服务器是否可以?
A:WAV文件由一个PCM文件头及PCM数据组成,PCM文件头是用于标识该WAV文件的PCM数据采样率、量化比特数、文件长度等信息。MIC录音得到的就是PCM数据,可以直接上传语音云进行识别,不需要添加PCM文件头。需要注意,MIC录音的PCM数据采样率与量化比特数需要与SessionBegin中设置的参数一致。

Q:QISRAudioWrite err 10214?
A:DNS解析错误,即域名转换到IP失败,可以换个网络通畅的环境,或者先用固定IP测试.

Q:如何实现位置记忆和复读?(一篇文章中途停止,记录下位置。下次再合成的时候从上次中断的位置开始。如何实现呢?)
A:返回的音频中,包括合成的进度信息(一段音频对应字符开始和结束位置),可以通过播放进度保存当前记录,下次继续播放当前位置。

Q:smk和rdn参数说明
A:: smk:合成参数,意义为" 拼音标注选项",取值范围:0,不要拼音标注,返回当前合成位置ced;3,不要简化的ced,返回拼音标注,信息中包含当前合成位置信息。可通过QTTSAudioInfo接口获取当前合成位置信息或拼音标注。
rdn:合成参数,意义为"数字合成选项",用于控制对阿拉伯数字合成的方式。取值范围:0表示自动,不确定时按照值发音;1表示按照值发音;2表示按照串发音;3表示自动,不确定时按照串发音。

Q:合成速度时快时慢?
A:auf=audio/L16;rate=16000参数中“;”前面有空格造成的(导致参数错误)

Q:ssm  参数?sub 参数?ent 参数?rst 参数?
A:ssm 会话模式  用来指明本次会话使用会话模式还是非会话模式。非会话模式:各个发往服务器的请求之间无关联,一次客户端服务器之间的交互可以完成一个独立的合成或识别/转写请求。会话模式:发往服务器的请求之间存在关联信息,所以会话模式可以完成一些较为复杂的功能,如可以将较长的音频分多次发往服务端,可以分批接收识别转写结果或合成音频等。当ssm=0或false的时候为非会话模式。当ssm=1或true的时候为会话模式。默认 0(老版本有ssm参数,目前版本默认ssm=1)
sub   请求类型 识别和语音听写都是通过QISR系列接口来完成,程序内部通过此参数来区分进行的是普通识别还是语音听写,iat(语音听写)asr(识别)。进行语音听写时此参数必须设置并且需指定为iat.  默认asr,
ent  引擎类型  sms8k, sms16k: 普通短信听写引擎。8K音频用8k引擎,16K音频用16k引擎,下同。video系列:视频搜索。
rst   识别结果格式 有plain和 json   默认 json