机器学习简介
2018-12-28 本文已影响0人
Haraway
一、什么是机器学习?
让机器,去学习
二、机器如何学习?
人类学习与机器学习过程对比三、人工智能、机器学习、深度学习之间的关系
人工智能-机器学习-深度学习关系图.png四、平台选择
1.演示环境或者科研环境用Scikit-learn
优点:算法种类多样,演示方便
缺点:不是分布式
语言:Python
2.生产环境用Spark MLLib
优点:分布式,能处理大数据;
缺点:算法种类不多
语言:Python、Scala、Java
学习资料:http://spark.apache.org/docs/latest/ml-guide.html
五、环境搭建
1.演示环境
语言:Python 3
框架:scikit-learn
IDE:Jupyter notebook
推荐使用开源环境管理工具Anaconda(官方网站)快速搭建演示环境。
Anaconda是一个开源的环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换,可以便捷获取包且对包能够进行管理,同时对环境可以统一管理。
Anaconda包含了conda、Python在内的超过180个科学包及其依赖项,比如:numpy、pandas等。
具体安装步骤参考:Anaconda一站式开发环境
2.生产环境
语言:Python 3
框架:Spark MLLib
IDE:IDEA
具体安装步骤参考:使用intellij idea 搭建Spark开发环境