人工智能

机器学习导论

2018-04-20  本文已影响27人  geekAppke

喂给算法大量数据,训练出模型

基本概念

基础+调包
经典算法,看看怎么用Scikit-learn调包
深度学习是机器学习的分支
    使计算机通过层次概念来学习经验和理解世界
关键特征、关键参数

监督学习

监督学习:训练数据拥有“标记”
    分类classfication:将预测结果离散为类别
      具体类别
      离散
          特征feature(输入) ——处理——>标签 (输出)
    回归regression
        具体数值
        连续

非监督学习

无监督学习:训练数据没有任何“标记”
    聚类
    关联分析
    PCA
对没有标记的数据进行分类——聚类分析
    足迹—>分类—>标记
对数据进行降维处理(赛选)
    特征提取:信用卡的信用评级和人的胖瘦无关?
    特征压缩:PCA算法,高维——>低微(保证质量)
——>方便可视化、异常检测

半监督学习

一部分数据有标记、另一部分没有
标记缺失
先无监督学习,在监督学习

增强学习

交互,行动,反馈(激励)
无人驾驶、机器人
机器学习算法 sklearn_map

数据

数据集、样本、特征(属性),标记
——数据数字化
向量约定小写、列向量
X大写—矩阵,y小写—向量

机器学习哲学思想

数据量越大,算法准确性越高
    数据即算法?
简单的就是好的,不要有过多假设、不要过多复杂化
脱离具体问题,谈论那个算法好是没有意义的
    具体问题多个算法对比试验,是必要的——找到合适算法!
面对不确定的世界,怎样看待使用机器学习进行预测结果?

大写矩阵、小写向量


图灵测试

人工智能发展历程

弱人工智能与强人工智能

人工智能、机器学习和人工智能


人类自己设计特征 vs 特征自己学习

上一篇下一篇

猜你喜欢

热点阅读