大数据与人工智能应用案例
随着AlphaGo一再挑起的人机大战,大数据、人工智能、机器学习,各种名词近两年的火爆程度在所关注的人看来简直可以媲美大牌明星,相关概念在资本市场也是风起云涌(甚至超过地产行业?)。然而,这些高级词汇对我们的生活来说到底意味着什么呢?
大数据是人工智能的前提,没有数据的“喂养”,机器无“数”可学,也就谈不上智能。且不说围棋高手AlphaGo,IBM的Watson这些“大杀器”,离我们日常较近的应用都是大规模数据训化的结果。
譬如语音识别,必需要有足够的语料库和人工字幕作为训练样本进行训练,才能得到较好的模型;譬如图片识别,算法的进步是一方面,海量图片本身以及相应的标注是相关智能应用产生的重要前提。而机器对自然语言的“理解”,更是将人工智能助手推向新高度。
1 语音识别+实时翻译,语言不再是问题
谷歌在201x年就在youtube 上上线了自动字幕系统,英文字幕生成体验简直不能再好:与语音同步、错词极少,除了符号(在英文环境中这也不是什么问题,完全不影响理解)。
Google 实时字幕技术自动字幕系统对技术要求较高,和通常输入法中用到的语音识别不同,自动字幕需要在语音出现的几乎同时对语音进行识别并生成文本,实时性也就意味着计算性能、算法上的更高要求。
而在实时语音识别的基础上,加上机器翻译,随着处理效率与准确率的提升,显然不同语言之间的沟通问题将有效解决。
国内目前科大讯飞在实时语音识别方面也做的不错,据报道中文识别准确率颇具竞争力。
还没有注意到国内视频网站有上线自动字幕系统的,如果有需要使用相关接口的,可以试下讯飞语音听写,或者微软必应语音API。
2 图像标注,行走的数据库
图像相关识别、标注在深度学习技术突破之后,有了明显的进展。谷哥训练机器自动识别阿猫阿狗已经是旧闻了,更进一步的应用已经可以被政府、个人使用
图片标注与监控
目前已经可以通过相关API 直接标注图片的内容范围:包括人物、情绪(快乐、悲伤、吃惊……)、是否包含成人内容等等。如果应用在安防层面,可以对监控视频内容中的所有元素进行识别,形成动态数据(包括物体类别、色彩、主要特征),为监控需要时提取目标元素提供最大便利。
微软-影像标注API图片分类
几年前做项目的时候客户还提过一个图片分类的想法:拍了太多照片,小孩的、大人的,靠人自己整理起来太麻烦,能不能自动归类——那时觉得太超前了。
而现在,iPhone 自带的图片应用已经可以基于人脸识别对图片进行自动归类了,即把所有出现同一人脸的照片分到一起。相信很快会有其它类似的、更智能的照片归档应用出现。
物体识别
APP-识花这一应用在植物识别方面已经在普及中。
试想出去逛公园,总会遇到一些不知名又好看的植物,在深度学习技术帮助下可以很方便的解决这个问题。只需要拍张图片,应用自动识别出植物名称。
3 智能助手,人人可享私人管家
IM时代,各色聊天机器人就层出不穷,其背后是大规模文本语料库的支持。iPhone 自带的Siri 让语音互动、语音操控为大众所熟悉。而随着语音交互、机器对语义理解的提升,以及远场拾音、可扩展技能(应用及控制设备),语音智能助手在智能家居方面已经显示出一定能力。
智能光应用示例具体消费级的应用已经产生,Amazon的Echo,Google 的Google home ,Rokid(国内创业企业)的 Pebble ,都是已发布的人工智能助手产品。
这类助手的“可扩展技能”都是开放的,类似于苹果的应用商店一样,每个技能都是一个应用,或者说是智能助手的一个skills,开发者可以通过接口开发相应的技能应用。目前Echo所累计的skills已经上万条了,像智能窗帘控制、插座开关与对应电器控制,都只需要类似对Siri 说话一样,喊一嗓子就可以完成了。
小结
人工智能显然已非概念或仅是个热闹,相信未来我们将习惯各种智能产品的陪伴,就如同我们现在用电、用水一样自然。
在各种技术开放、大企业纷纷将算法开源、算力成本又不断降低的背景下,如何寻找智能应用点以及对应训练所需的成规模数据,成为大数据与人工智能应用的关键点。
如果你有很好的已标数据,或者期望人工智能解决的行业问题,赶快留言吧!
参考:
1.微软oxford人工智能平台 www.projectoxford.ai
2.形色APP(植物识别)
3.知乎智能助手相关主题资料