一个只用7天就能搞懂人工智能敲门砖
一个只用7天就能搞懂人工智能敲门砖——KNN算法!
想要长期混迹于AI领域的同学来说,对算法有一个初步、通识的了解是非常有必要的。
今天我们就从一个最为简单、易懂的“K-近邻(KNN)算法”聊起!通过代码走进机器学习的大门,搞定传统机器学习算法。
天下苦数学久矣!偏偏人工智能需要数学基础,知己知彼百战不殆,先去了解AI 能做哪些?
对于很多想要入门机器学习的工程师来说,数学是通往AI道路上的第一支拦路虎。一些已经工作的同学不得不捡起早已还给老师的数学知识,被一个个复杂的机公式劝退,或记下一堆公式定理之后却不知道和代码有什么关系,茫然不知所措。
其实对于工程师来说,最直接的入门方法就是coding。
首先会介绍算法的基本原理,然后依据原理手动实现算法,会提供的机器学习库完成一些小demo。不用担心,相关的机器学习概念以及算法原理也会穿插其中,帮助你以“代码->原理->代码”这种迭代的方式完成学习。
子曰:“先行其言而后从之”
行动永远是引发改变的第一步
1
为什么说KNN算法是机器学习的敲门砖?
KNN算法非常适合入门:KNN算法思想简单朴素,容易理解,几乎不需要任何数学知识
KNN算法很好用:理论成熟,简单粗暴,既可以用来做分类(天然支持多分类),也可以用来做回归
kNN算法简单,机器学习算法过程中的很多细节问题,能够完整的刻画机器学习应用的流程
2
KNN的核心思想
用一句俗语表达:“物以类聚、人以群分”,想了解一个人,可以看他交什么样的朋友。即它的核心思想是:如果一个样本在特征空间中的k个最相邻的样本(距离最近的样本)中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
3
KNN的优劣势
优势:
简单,易于理解,易于实现,无需估计参数,无需训练;
特别适合于多分类问题(multi-modal,对象具有多个类别标签), kNN比SVM的表现要好。
缺点:
计算复杂度高、空间复杂度高;
样本严重不平衡时,如果一个类的样本容量很大,而其他类很小,有可能导致输入一个新样本时,被误判为该分类的概率会很大。
4
适用领域
模式识别,特别是光学字符识别;
统计分类;
计算机视觉;
数据库,如基于内容的图像检索;
编码理论(最大似然编码);
数据压缩(mpeg-2标准);
向导系统;
网络营销;
DNA测序
拼写检查,建议正确拼写;
剽窃侦查;
相似比分算法,用来推动运动员的职业表现
好课来也!
AI 快速实战入门课程 限时免费7天!
1
课程简介
阶段概述:本阶段讲解,人工智能的应用,人工智能的工作流程、基本概念,人工智能的任务和本质,KNN最近邻算法。
达成目标:通过本阶段学习,快速理解人工智能能做什么,要做什么,并掌握KNN算法以及算法的代码实现。
2
名师手把手领你入门
头衔:人工智能学院院长,自然语言理解、机器学习资深研发专家,中国计算机学会高级专家
领域:人工智能明星讲师、大数据高级讲师
资历:毕业于比利时鲁汶大学,KU Leuven,曾任职Barco和新浪。电子信息系统专业毕业。就业于Barco公司,从事医疗图像处理相关工作。后致力于回国发展,任职于新浪,应用大数据技术和算法对海量数据分析以及挖掘。现投身教育事业,因为最看好未来的医疗、娱乐、教育三大产业中的教育产业。并且享受桃李满天下的获得感。
服务理念:能举个例子讲明白的,绝不重复!能一句话讲明白的,绝不唠叨!
3
课程大纲
第1节:概率论_随机事件与随机事件概率
第2节:条件概率_贝叶斯公式
第3节:随机变量
第4节:数学期望和方差
第5节:常用随机变量服从的分布
第6节:随机向量_独立性_协方差_随机向量的正太分布
第7节:最大似然估计思想