朴素贝叶斯分类算法
2020-06-24 本文已影响0人
人间桑
1、分类问题综述
日常生活中我们每天都进行着分类过程 “这个人一看就很有钱”
分类算法的任务就是构造分类器f。
2、朴素贝叶斯分类
核心算法:


3、例题分析

求p(嫁|不帅、性格不好、身高矮、不上进)的概率

4、朴素贝叶斯算法的朴素一词解释
朴素即需要特征之间相互独立 有时会牺牲一定的分类准确率
假设独立的原因:1、特征太多 2、符合样本太少
p(不帅、性格不好、身高矮、不上进|嫁) = p(不帅|嫁)*p(性格不好|嫁)*p(身高矮|嫁)*p(不上进|嫁)
p(不帅、性格不好、身高矮、不上进) = p(不帅)*p(性格不好)*p(身高矮)*p(不上进) 这是错的!!!
p(不帅、性格不好、身高矮、不上进) = p(嫁)*p(不帅|嫁)*p(性格不好|嫁)*p(身高矮|嫁)*p(不上进|嫁) +
p(不嫁)*p(不帅|不嫁)*p(性格不好|不嫁)*p(身高矮|不嫁)*p(不上进|不嫁)
5 、朴素贝叶斯分类的优缺点
优点:算法逻辑简单 易于实现 分类过程时空开销小
缺点:属性之间互相独立的假设往往不成立