01-30

2019-01-30  本文已影响0人  姬汉斯

今天看的是关于文档识别和分类的处理案例。利用多项式贝叶斯公式计算TF-IDF值,以此计算出文档中的词频,文档频率等数据属性,TFIDFVectorizer类用于进行整理,NTLK包进行标注处理,计算文档中各个字符的权重,通过分类器进行分类处理。Sklearn在其中依然有巨大作用,还在熟悉其特性

上一篇下一篇

猜你喜欢

热点阅读