漫谈 AI——人工智能技术&应用现状分析
人工智能技术&应用现状分析
引言
当下,人工智能已然跃居为全球话题的焦点,来自开发者、业界领袖、政策制定者乃至大众的关注正与日俱增。
本文前半部分主要介绍人工智能这个领域的应用现状,后半部分主要讲解深度学习神经网络技术入门。
参考文献:
今日头条和斯坦福大学&机器之心联合发布AI2017年度报告:http://cdn.aiindex.org/AI-Index-2017-Chinese-Translation.pdf
AI发展现状剖析来自36氪:https://36kr.com/p/5125088.html
神经网络发展历程:https://www.cnblogs.com/subconscious/p/5058741.html
人工智能现状
人工智能vs机器学习vs深度学习vs神经网络 概念
什么是人工智能?它和神经网络、机器学习、深度学习、数据挖掘这类热门词汇有什么关系?撇开复杂的概念和高冷的定义,一图看懂人工智能相关领域的错综复杂的关系。
由图可见,人工智能、机器学习、深度学习并非是层层包含的关系,而最近火热的神经网络也只是与人工智能有交叉而非人工智能的实现方式或者子集。
AI知识图谱趋势:
人工智能必要条件
人工智能基础条件的成熟为商业化奠定了基础
数据、算法和算力是人工智能的三驾马车,2012年以后,得益于数据量的上涨、机器学习新算法(深度学习)的出现和运算力的提升,人工智能开始大爆发。
数据的爆发式增长为人工智能提供了充分的“养料”,市场调研机构IDC预计,到2020年,全球数据总量将达到40ZB,我国数据量将达到8.6ZB,占全球的21%左右。
算法方面,深度学习的出现突破了过去机器学习领域浅层学习算法的局限,颠覆了语音识别、语义理解、计算机视觉等基础应用领域的算法设计思路。
算力方面,GPU、NPU、FPGA等专用芯片的出现,使得数据处理速度不再成为人工智能发展的瓶颈。
人工智能应用领域与机会
参考文献36氪:https://36kr.com/p/5125088.html
1、机器人
机器人创业公司主要着力于个人机器人(如智能音箱、扫地机器人、儿童教育/陪护机器人),面向C端用户;传统机器人制造商则更看重人工智能对自身现有产品/技术的改造,应用场景也多为商业服务及工业生产;而IT互联网公司(主要是电商公司)则希望通过人工智能机器人提升自身业务的效率。
2、 智能家居
智能音箱:这个领域已经在蓬勃发展。小米AI-小爱同学、天猫精灵、出门问问-问问音箱 排行前三名的音响品牌。语音识别,自然语言处理技术在硬件领域的应用。
智能摄像头:计算机视觉、图像识别技术的发展,催生家庭安防设备产品的发展。传统摄像头相比,智能摄像头对画面的识别更加精细,并因此能够做出更多有针对性的响应。例如识别陌生的人脸,当陌生人闯入住宅时即可自动报警;识别车牌,令车库门自动打开;识别宠物异常行为,当宠物在家中搞破坏时及时播放警报声将其吓跑。有些智能摄像头甚至兼具了语音助理的部分功能。这些功能在家庭、商场、学校等场景中都能发挥强大的作用。
排行前五的智能摄像机:萤石云视频、360智能摄像机、小蚁摄像机、乐橙、爱耳目家庭摄像机、米家摄像机。传统安防企业海康威视在智能摄像机处于领先地位。
智能家居平台:布局全平台的智能家居产品,如米家、360智能管家、华为智能家居、阿里智能、美居、海尔、京东微联、小K智能。
3、移动互联网
智能推荐:人工智能对于推荐系统的影响是巨大的。在“非智能”时代,推荐主要依靠专业编辑或是一些从直觉引导出的简单模型或算法,而深度学习模型的应用,使得一些已知问题上的推荐效率得到提高。如今,几乎一切资讯类、娱乐类、电商类等互联网应用,都不离开人工智能的支持,甚至可以说人工智能加持的推荐系统已经是互联网服务的一个核心环节。
智能推荐引擎:今日头条、腾讯新闻、天天快报、趣头条、新浪新闻等。
同样得益于推荐算法,短视频近年也得到了长足的发展。
智能顾问:人工智能在金融领域的拓展,财富管理领域的需求也将进一步发展。
其他:智能教育、智慧医疗:AI+医疗的商业化较为谨慎、智能导航
人工智能基础设施规划
语音技术/计算机视觉落地最给力
语音识别/自然语言处理,科大讯飞是语音识别的领头羊。
计算机视觉:目前,人脸识别、视频监控、互联网图像内容审查,已经成为计算机视觉技术的产业入口。
人工智能开发平台:百度和腾讯处于领先地位
机器学习开源平台:
这篇文章阐述了国内的开源平台,Tensorflow、Caffe、Spark等国外开源平台已经蓬勃发展。
AI芯片:
百度的DuerOS智慧芯片、寒武纪、地平线、中星微电子、深鉴科技等企业发力。
机器学习入门
机器学习分为有监督学习和无监督学习。
github仓库(专门用作机器学习的库):https://github.com/scikit-learn/scikit-learn
机器学习算法:回归、聚类、分类、关联算法。这些算法都是企业大数据平台必备的应用算法。用来作为用户分析、数据运营。
深度学习入门
参考文献:计算机的潜意识: https://www.cnblogs.com/subconscious/p/5058741.html
深度学习神经网络发展历程
神经网络经历了三次的发展高峰与低谷期。
第一阶段 模型起步期
从1943年MP的诞生到1958年的感知机诞生,由于算法的缺陷,1969年经理了漫长的低谷期。
第二阶段 模型突破期
1986年BP两层神经网络,反向传播算法,最优解求解思路是梯度下降法。这个时候两层神经网络已经能够在图像识别、语音处理和自动驾驶领域有了一定应用。但是由于计算能力的限制和SVM的兴起,神经网络算法一度一蹶不振。
第三阶段 另辟蹊径
参考文献 李飞飞与ImageNet:https://zhuanlan.zhihu.com/p/28179414
2006,以李飞飞为主的一波人工智能科学家开始为AI注入大数据。2013年Hinton发现CNN卷积神经网络,将图片分类错误率降低到了15%以下。这一阶段,海量训练数据的产生,GPU和集群算力,超过百万倍的计算能力的提升,以及CNN 超过100层神经网络的发展,AI的智能程度得到极大提升。
AI历史可以追溯到20世界40年底啊,但是人工智能真正开始应用的才不到10个年头,并在语音识别、图像识别、自动驾驶、电商等领域迸发出巨大能量。
回到我们对神经网络历史的讨论,根据历史趋势图来看,神经网络以及深度学习会不会像以往一样再次陷入谷底?作者认为,这个过程可能取决于量子计算机的发展。
根据一些最近的研究发现,人脑内部进行的计算可能是类似于量子计算形态的东西。而且目前已知的最大神经网络跟人脑的神经元数量相比,仍然显得非常小,仅不及1%左右。所以未来真正想实现人脑神经网络的模拟,可能需要借助量子计算的强大计算能力。下一个阶段量子计算的兴起也许是AI突破发展瓶颈的一个时期,但是在量子计算还处于突破阶段的今天,下个寒冬期会是什么时候?
模型算法和大数据已经走在了正确的方向上,计算能力将是制约AI发展的关键:
深度学习 TensorFlow案例
深度学习框架是对神经网络整一套实现流程进行封装,避免重复造轮子。开发者基于这些开源框架,在既定流程上实现所需功能。
深度学习神经网络框架:谷歌的TensorFlow、加州大学伯克利分校的Caffe、Keras,还有Facebook的Torch,微软的CNTK。入门级建议使用TensorFlow框架。
小米深度学习AI技术架构:参考:https://juejin.im/entry/594a2a69ac502e5490f95740
参考:http://note.youdao.com/noteshare?id=c3a02ac8de442cb36ca61707a533851a
案例一:全连接神经网络
github地址:https://github.com/FisherEat/python_tensorflow.git
案例二:CNN卷积神经网络
github地址:https://github.com/FisherEat/python_mashine_projects.git