本帖最后由 小盒子 于 2017-2-17 11:21 编辑
在语音转写上线不到两个月的时间里,转写小组收到了很多意见和反馈,非常感谢大家的关注与支持! 关于语音转写产品的所有信息都可以在 转写产品详情页 找到相关资料或者链接。 本版块专属用于语音转写的相关技术交流和通知发布,并且会定期发布大家的问题解答汇总,也欢迎大家踊跃发帖。
最近,转写小组总结&解答了一些大家比较关注的问题,并且首次公布了部分后续的版本计划,希望可以帮助到大家~ 1、 同音字识别 由于转写支持上传的是长段音频,所以转写引擎可以结合音频上下文的语义,最佳匹配成跟此音频语义语境最相近的词。也就是说,上传的音频越长,识别率会越高。
2、 关于用户的个性化专有词的识别 因为现在的转写模型为通用模型,对于一些特殊领域专有词以及用户的个性化词转写引擎会识别成常见词。针对这个情况,我们会在后续版本推出可以供用户自定义上传文本语料的接口,更大程度地支持更个性化的识别。
3、关 键 词 鉴别 现有版本下,需要您自行将文本结果进行搜索匹配。后续版本会上线输出多候选词,并且推出 关 键 词检索功能。
4、大音频上传速度问题 由于更高的码流率可以给您带来更高的识别率,但是同时也必须要耗费更多传输的时间。在保证音频识别率的基础上,如果您有大量的并且音频文件比较大的转写任务,为了让您更快速地上传音频文件,可以采用: (1)上传音频和获取结果请避开语音云的高峰期18:00~24:00。 (2)在音频码流率比较高造成的音频文件比较大的情况下,建议使用opus和flac格式,后期会支持压缩比更高的speex格式。
另外插播一条重要通知:
欢迎大家在本版块交流沟通,转写小组成员会及时为大家解答,好的意见或建议请赶紧砸过来吧! |