Weka在数据挖掘中的运用 05 Using a filter

2020-10-02  本文已影响0人  jenye_

删除一个属性


现在我们要移除humidity这个属性(序号为3).
在预处理面板可以选择Filter(过滤器)


在无监督过滤器中,我们可以找到attribute过滤器和instace过滤器。

我们现在要删除一个属性,因此使用一个属性过滤器。

属性过滤器也有很多,找到一个适合的:




配置过滤器



第一个参数输入remove的属性的序号。

第二个参数颠倒选择,就是删除选择序号以外的属性。

实际上有更简单的方式,在界面上,只需要选择属性,然后点击remove就行了。




但实际上,过滤器可以完成更复杂的事情。


过滤实例

接下来,我们尝试不删除某个属性,而是删除所有湿度值(humidity)为high的实例。属性对应的序号依然是3。

  1. 选择一个实例过滤器
  2. 这里用Remove with value


  3. 通过配置界面More



    Filters instances accoording to hte value of an attribute.
    刚好是我们要用到的功能。

  4. 配置好属性的序号,和属性值的序号(离散型)
  5. 点击Applay就进行了过滤


    过滤前
    过滤后

    7.如果你需要修改数据集,可以点击Save进行修改。(这里不要修改),点击Undo就可以撤销操作。
    总结:



过滤的意义

有时候通过过滤可以得到一个更好的分类。
举一个简单的例子:
这里依然用到glass.arff数据集

事实上有的时候效果会更加明显

上一篇 下一篇

猜你喜欢

热点阅读