机器学习基础系列

决策树系列

2019-07-14  本文已影响0人  邓沉香

决策树:

  1. 信息增益(ID3)
  2. 信息增益比(C4.5)
  3. GINI指数(用于CART中分类树生成)

  1. 信息增益(ID3):
    g(D,A)=H(D)-H(D|A)
    其中g(D,A)为所计算的增益值,其中参数D为整个训练样本集合,A为样本的某一特征。
    H(D)=-\displaystyle \sum^{K}_{k=1}{\frac{|C_k|}{|D|}}\log(\frac{|C_k|}{|D|})
    其中C_k表示样本集合D被分成k类之后每一类的样本集合,|C_k|则表示该集合的样本个数。|D|同理。
    H(D|A)=\displaystyle \sum^{n}_{i=1}{\frac{|D_i|}{|D|}}H(D_i)=-\displaystyle \sum^{n}_{i=1}{\frac{|D_i|}{|D|}}\displaystyle \sum^{K}_{k=1}{\frac{|D_{ik}|}{|D_i|}}\log(\frac{|D_{ik}|}{|D_i|})
上一篇 下一篇

猜你喜欢

热点阅读