帖子

[官方问题解答] 听写个性化热词---应用级热词&用户级热词

[复制链接]
  • TA的每日心情
    慵懒
    2017-8-18 10:54
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    1930  楼主| 百花 发表于 2019-11-19 16:16:25 1#
          前情提要
          无论在哪一种语言中,不同的单词或字(word),或多或少,都会有相似的发音(pronounce)。尤其在汉语中,这种现象更普遍,如当一个人说 /zhang/ /s[h]an/ 时,对应的词语的组成,可能是 {张,章,彰,...} {三,姗,珊,...},这些文字的组合,在汉语的习惯中出现频率最高的,当然是“张三”了。而在听写返回结果时,会结合上下文,把日常生活中,出现频率最高的词汇返回给客户端。这时,如果我们实际想要的结果并不是出现频率最高的词汇,如上文中我们实际要的是“张姗”——这样的情况在手机联系人信息中经常会出现,此时听写结果就不是  我们想要的。这种情况下,我们可以通过上传个性化热词的方式,把在同样发音情况下,自己希望最优先匹配的词语告知语音云服务器。简言之,个性化热词,即让应用准确识别特定的词语(“热词”),即你上传“布吉”“王剑”等词汇,这样服务器在识别的时候会增加热词的识别权重,需要注意的这些个性化信息只是增加相应词条的识别率,但并不是绝对的。例如:上传了“吴及”,那么你说“wu2 ji2”是可以正确听写出“吴及”的,但是如果你说“dian4 ying3 wu2 ji2”,则听写结果有可能是“电影无极”。

            在线听写(流式版)中才支持上传热词的功能,且仅支持中文,不支持数字和英文及其他小语种,离线听写是不支持的。热词分为用户级热词和应用级热词。
           应用级热词:在网页上上传的是应用级热词(讯飞开放平台官网—控制台—应用的中的语音听写下),上传后1-2小时后生效,应用级热词是对所有运行你应用的设备都生效,更新给当前APPID的所有使用设备。
            用户级热词:在程序代码中上传的叫用户级热词(demo里面有代码示例),用户级热词只对上传热词的某个用户(设备)生效,一般上传后10分钟左右生效,影响的范围是,当前 APPID 应用的当前设备——即同一应用,不同设备里上传的热词互不干扰;同一设备,不同APPID的应用上传的热词互不干扰。

            使用方法
            应用级热词(所有平台适用):登录讯飞开放平台页面后,点击右上角控制台----点击应用中的在线听写(流式)服务---个性化热词---上传热词---发布热词(一般生效时间1小时以后)(如下图所示)        
            用户级热词(需要下载某个平台的sdk,sdk中设置)不同平台设置方法不同(如下图所示)(webapi暂不支持用户级热词)
            Android:http://mscdoc.xfyun.cn/android/api/(用户词表类UserWords)sdk中的上传联系人与上传词表即为用户级热词的示例
            iOS:sdk中的上传联系人与上传词表即为用户级热词的示例(http://mscdoc.xfyun.cn/ios/api/
            Windows&Linux:http://mscdoc.xfyun.cn/windows/api中的MSPUploadData() sdk中有上传用户词表的示例


    应用级热词

    应用级热词

    用户级热词

    用户级热词

    评分

    参与人数 1语点 +50 收起 理由
    打豆豆 + 50 很给力!

    查看全部评分