帖子

小于1分钟的短视频语音识别成字幕,应该用语音听写还是...

[复制链接]

该用户从未签到

3722  楼主| 459909881@qq.co 发表于 2020-4-13 17:48:36 1#
小于1分钟的短视频语音识别成字幕,应该用语音听写还是语音转写?
133****6261 发表于 2020-4-15 14:25:06
2#
应该用语音转写,我今天还查了下他们的区别,如下:
使用场景:
1、语音听写主要应用于需要实时识别短语音的需求场景,它可以实时的识别60s以内的短语音,典型的应用场景有语音输入法、语音搜索、语音人机交互等等;
2、非实时语音转写主要用来识别长段的录音文件(5小时以内),但是它不能实时返回识别结果,根据上传的文件大小需要几分钟至几个小时不等才能获取到识别结果(结果是一次性获取),典型的应用场景是识别电话录音文件以便客户自己做文字质检、识别会议录音方便客户自己整理会议纪要。
3、实时语音转写可以实时识别持续的音频流,结果是实时返回,音频流长度理论上不做限制,典型的应用场景是大会或者直播的实时字幕。

楼内回复

很准确  详情 发表于 2020-4-17 10:25
使用道具 举报 回复
177****8010 发表于 2020-4-17 10:25:14
3#
133****6261 发表于 2020-4-15 14:25
应该用语音转写,我今天还查了下他们的区别,如下:
使用场景:
1、语音听写主要应用于需要实时识别短语音 ...

很准确
使用道具 举报 回复