Android技术知识

车联网-语音方案比对介绍

2017-07-05  本文已影响0人  莫君陌

语音方案比对介绍

语音交互是现今应用最多的智能交互方式,在人工智能越来越火的当下应用十分广泛,所以特别针对车内环境,在驾驶员安心驾驶的时候,用语音可以安全的进行操控,所以针对公司的车联网的业务需求,我做了一个语音方案的研究和比对。

语音需求

整体来说语音需求,选择的语音方案至少要满足语音唤醒,语音合成,语义解析三大基础功能

  1. 语音唤醒: 能够通过唤醒词,唤醒语音助手,进行后续用户语义的识别,免去手动点击唤醒的操作
  2. 语音合成: 俗称TTS(Text To Speech),支持将文本转换成语音播报出来
  3. 语义解析: 支持将用户输入的语音,转换成文本,并进行相应的分析,定位到相应的场景,关键字 返回结果帮助我们定位到用户需求。
    例如:"导航到深圳北站",除了解析语音返回整句文本之外,还需要定位到这是地图场景,关键字是POI点深圳北站

语音方案

现今市面上比较常用的语音方案有:腾讯云语音讯飞语音百度语音思必驰云知声同行者,搜狗语音云

所以暂时着重比对介绍一下腾讯云语音讯飞语音百度语音, 云知声搜狗语音云

讯飞语音

讯飞语音开发平台 云知声语音开发平台

优点:

缺点:

备注: 云知声的对外开放平台,主要功能和使用形式同讯飞基本一致,唤醒和离线语音合成都需要收费定制化开发

讯飞语音开发平台 云知声语音开发平台


讯飞语音服务

腾讯云语音

腾讯云语音

使用腾讯云语音需要注册腾讯云账号,添加项目和服务,云语音只是整个腾讯云中的一个产品,不收费

特点:

腾讯云产品总览 腾讯云语音识别功能 腾讯云语音合成功能-场景 腾讯云语音合成架构

百度语音

百度语音

特点:

自定义语义
语义数据结构
导出唤醒词

搜狗语音云

搜狗语音云

特点:

总结

经过比对和试用SDK Demo,总体来说,百度语音最适合,,不仅能够满足我们的语音需求,还支持自定义深度优化,相比较其他语音方案,百度语音具有以下三大优势:

  1. 免费支持语音唤醒,相对比其他方案,唤醒都是收费的,而且还能够支持最多三个自定义唤醒词

  2. 提供离线语音识别和语音合成,其他语音方案只提供在线语音合成和识别,离线都需要收费,百度语音免费提供,能够减少很大的流量消耗

  3. 能够自定义语义,我们可以根据自己的业务需求定义一些语义加入到离线识别中,做到深度化定制,给用户更好的体验,
    例如:"我要点肯德基","打开行车记录仪"

上一篇 下一篇

猜你喜欢

热点阅读