帖子

语音听写、语音转写、实时语音转写三者有什么区别?

[复制链接]
匿名
53271 匿名  发表于 2018-12-20 19:20:57 1#
使用场景:
1、语音听写主要应用于需要实时识别短语音的需求场景,它可以实时的识别60s以内的短语音,典型的应用场景有语音输入法、语音搜索、语音人机交互等等;
2、非实时语音转写主要用来识别长段的录音文件(5小时以内),但是它不能实时返回识别结果,根据上传的文件大小需要几分钟至几个小时不等才能获取到识别结果(结果是一次性获取),典型的应用场景是识别电话录音文件以便客户自己做文字质检、识别会议录音方便客户自己整理会议纪要。
3、实时语音转写可以实时识别持续的音频流,结果是实时返回,音频流长度理论上不做限制,典型的应用场景是大会或者直播的实时字幕。

接口类型:
语音听写可支持Android\IOS\Linux\Windows\Java\webapi,
语音转写只支持Java,webapi平台,实时语音转写只支持webapi接口;

支持语言:
语音听写可支持中英文及部分方言,两种转写都只支持中文普通话;

音频格式:
1、语音听写必须是采样率为8KHz或16KHz,采样深度16bit,单声道的wav或pcm
2、非实时转写wav,flac,opus,m4a,mp3,单声道&多声道
3、实时转写采样率为16K,采样深度为16bits的单声道pcm音频

收费方式:
语音听写按照交互次数收费,前期提供500次免费次数供试用 ;非实时转写是按时长收费,前期为每个帐号提供5个小时的免费时长供试用;实时转写按照授权路数收费。

流浪者 发表于 2018-12-21 08:23:05
2#
谢谢分享,收藏学习

使用道具 举报 回复