《科学背单词法》02 -- CET4数据分析

2019-03-09  本文已影响0人  Andy计算机专业
《科学背单词法》02

[上一篇]英语四六级历年真题数据爬取2_1

[本文主要涉及知识点]:数据合并、数据清洗、分词、词频统计、读写txt、读写excel

一、今日主题:英语四六级历年真题数据分析2_2

(1)合并所有真题数据,如下:

1. 原始数据目录目录 2.代码实现 3.执行结果-->OK!

(2)对合并数据-->数据清洗

1.源数据 2.正则匹配数据清洗方案 3.数据清洗结果数据

(3)对数据清洗结果数据-->分词、词频统计-->词频表

1.代码实现 2.结果文件展示 3.词频结果展示 4.excel词频表

五、闲聊

[1].代码截止2019-03-09调试无误。

[2].下一篇将对照词频表-->查询单词释义。

让知识或技术实现其最大的价值,欢迎收藏自用、转载分享,转载请注明原文出处,谢谢!

上一篇下一篇

猜你喜欢

热点阅读