帖子

[资源经验分享] 初步了解科大讯飞AIUI开放平台,共同感受人工智能的魅力!

[复制链接]

该用户从未签到

500 182****6102 发表于 2019-1-9 16:52:07 1#
本帖最后由 182****6102 于 2019-1-9 16:58 编辑

开放平台.png

科大讯飞AIUI初步了解


自科大讯飞1999年成立,2008年在深圳证券交易所成功上市以来,逐步在语音合成 语音识别 语言翻译等等各个领域取得了重大突破!
人工智能的逐步深入我们日常的生活其更离不开,人机交互以及人机语音合成识别等各个领域,今天在此小编就和大家一起探讨一下科大讯飞的AIUI人机交互的产品!
AIUI产品解析:
科大讯飞的AIUI集成了包括双全工技术,麦克风阵列技术、声纹识别技术、方言识别、语义理解技术的家奴单科研成果和完善服务,其也代表了业界最高的水准技术产品,!
小编再次就和大家详细道来AIUI智能语音的体验的
首先先给大家绘制一张”科大讯飞AIUI的功能说明图”

图文解析:
图文解析.png
目前AIUI技能商店中的,技能的场景比如技能开发中天气这种通用功能,且查询时不需要跟用户信息关联,有可预知的**天气等(其也就是所谓的自定义实体)
AIUI 开放平台主要包含了语义技能(Skill)、问答库(Q&A)编辑以及AIUI 应用(硬件)云端配置的能力
并为不同形态产品提供了不同的接入方式。目前有如下接入方式有,Android、iOS、Windows、Linux SDK
基于 HTTP 协议的 WebAPI,以及软硬一体的AIUI评估板(量产板)讯飞魔飞智能麦克风

其中选择JSON即可看到详细代码对于开发者而言,小编真心感觉挺不错的!
图文解析1.png 图文解析2.png
AIUI应用领域:
AIUI 解决方案可以应用于多种领域与产品。包括但不限于智能手机(终端)
服务型机器人、玩具机器人,音箱、玩具、手办、车载、智能家居、智能客服、医疗导诊。
其更在智能手机、手表或 PC 等终端中,AIUI 可以与手机深度结合为全局的智能语音控制系统。在单个应用(APP)中,可以帮助用户用语音完成复杂的交互,例如导航,买票,订餐等…
aiui应用领域.jpg
小编在去调用AIUI开发平台去调用技能商店的技能的时候看到了AIUI的产品框架,接下来我们就好好的分析一下AIUI产品的框架,从硬件层面的拾音降噪声音定位回声消除到我们,软件层面的人声检测语音唤醒以及合成数据传输管理构成了一个,智能终端设备的框架图,从中不难看出从软件也好直到硬件也罢都可以看出整个智能产品且巧妙地结合了我们AIUI开放平台的特点!
aiui应用领域2.png
下面则是从云端的语音方言以及特征语义AVD的一个上下文识别,再到我们语义场景切换长时记忆上下文的一个理解,从而由我们内容音乐天气互动百科,便捷生活以及各种技能的赋能接入使得我们整个产品变得更加智能更加生动起来,从而构建了大数据平台的一个,个性化的系统这就是我们AIUI的产品框架解析,因为赋能更加智能…
了解了我们AIUI的产品框架接下来小编就带大家了解一下我们AIUI产品的特性以及技能层面的应用!
产品特性:
智能家居语音唤醒
下班回家后,一天的折腾疲惫是难免的,回到自己还需要去做饭收拾房间做家务,肯定就崩溃了,但是曾许何时你是否想过,如果回到家的时候或者是在回家的路上,途中这些就都已经完成了呢?
那么接下来小编就带大家了解一下我们AIUI技能商店的一大亮点“智能家居”
迈入房门的那一刻起,“小飞小飞 把灯打开”客厅以及廊道的暖灯都已打开!
产品特性开灯.png
晚归回到家中的你,些许疲惫你则只需“小飞小飞 把空调打开,则将空调度数调到最佳的状态,即可躺下来好好休息下”
产品特性空调.png
已经提前将食材放入了电饭煲内,嗨 小飞“将电饭煲打开煮饭定时十分钟”趁着煮饭的时间可以好好的休息下咯!
产品特性电饭煲.png
在这里小编只是在线上AIUI的技能商店内简单的和大家介绍一下,其调用使用起来也是非常的方便,简单的测试讲解下因为硬件受限,后续在小编写的其他文献中将给大家,实地的去给我们大家测试下AIUI的相关产品以及调用等等,如有感兴趣的小伙伴也可以去试试看哦!
语音降噪、回声消除、全双工交互:
语音降噪指降低环境噪音,提高人声辨识度,基于讯飞多麦克风阵列,AIUI 在实现降噪的同时可以确定唤醒的方向,并抑制其它方向的人声。
回声消除指产品扬声器发声(TTS 或播放音频)时,可以不关闭产品麦克风的拾音功能,扬声器的回声可以通过讯飞的降噪算法消除,不送入语音识别引擎。
全双工交互指在设备扬声器发声时,且不关闭麦克风的情况下,用户可以打断设备的播放,进行语音识别和语义理解。
接下来给大家展示一个案例如下:

用户:小飞小飞,合肥市今天的天气怎么样
音响:合肥市今天全天小雨,出门记得带伞,气温12℃ ~ 15℃
空气质量重度污染,有南风微风,有点凉!
用户:(期间打断)*小飞小飞*,今天适合运动吗?那明天天气呢?
音响:合肥市今天有降水,推荐您在室内进行各种健身休闲运动
若坚持户外运动,须注意保暖并携带雨具!
音响:明天合肥市全天中雨转小雨,出门记得带伞
气温8℃ ~ 14℃,有北风微风,有点凉!

对照上面用户的提问语义理解则为指将一句自然语言转化为计算机可读的结构化数据。语义理解也是 AIUI 的核心功能。

例如“明天合肥天气怎么样”这句自然语言中,经过AIUI 语义理解引擎,会将这句话解析成如下的Json数据
(部分实例代码如下):
{
"semantic":[
    {
      "intent": "QUERY",
      "slots": [
        {
          "name":"datetime",
          "normValue":"2018-01-19"
        },
        {
          "name": "city",
          "normValue": "合肥"
        }
    }
  ],
  "service": "weather"
}

多重方言的识别语音降噪 回声消除 案例展现!
AIUI将讯飞强大的单点交互能力(前端声学处理,语义理解,语音合成,丰富的内容信源)整合为全链路的交互方案提供给广大开发者,开发者可以根据实际的业务需求,利用热词静态实体动态实体所见即可说等特性,进行个性化的优化和改进,提升交互准确率,让人机交互更加流畅,真正的满足和解决用户实际使用中所遇到的问题。

开放选择实体的接入更便于我们开发者使用和更好的完善我们的作品,赋能未来AI动起来!
开放实体.png
以及开发者语音个人技能创建等等,莫过于最让小编感到,激动的还是我们科大讯飞的翻译和语音合成以及语音识别技术
翻译.png 翻译代码.png
最值得我们开发者以及我们用户去关注的就是,我们科大讯飞的AIUI开放平台的技能商店,皆一切赋能将从这里开始,此皆可称为AI赋能的发源地,其中涵盖的小编个人比较喜欢的一些比如是:”效率办公 生活服务 金融商业和智能家居等等……”

科大讯飞AIUI开放平台技能商店 功能一览
aiui商店.png
aiui商店2.png
AIUI 开放平台不仅提供了包括天气、股票、音乐等150+种技能(陆续上架中),还包括情绪、感情、问候等八种开放问答,满足用户的闲聊需求。此外AIUI 技能商店接受讯飞开放平台数量众多的开发者共享自定义技能,通过技能共享开放可以帮助开发者进一步降低产品研发成本。
同传翻译语音识别文字转语音的语音合成支持平台:产品介绍以及开发者应用范围如硬件和软件层面的HTTP以及微信小程序和app的使用其微信小程序 讯飞翻译 讯飞快读 就很好的彰显了我们科大讯飞的语音合成和语音识别的特点其讯飞听见APP也彰显了我们讯飞同传翻译以及语音识别的准确率感兴趣的小伙伴们可以下载去体验下,后续小编将专注出一期介绍,讯飞语音识别以及语音合成的文章
小编个人心得:
赋能人工智能最大的特点其最基础的也就是,我们人机交互和语音识别,恰巧科大讯飞在人机交互领域起到了,承上启下的作用小编个人也作为开发者对科大讯飞AIUI开放平台为开发者所,提供的平台也是非常的喜欢!

关于“科大讯飞”为热爱人工智能人机交互的,开发者们所提供的AIUI开放平台身为技术大牛或者是,刚接触人工智能的小白你对此有何建议以及自己的想法,可下面评论区留言进行讨论哦!