IT 互联网 网络安全 程序员程序员

程序员代码下的许豪杰

2017-08-03  本文已影响2001人  简书说我的昵称违规

最近豆瓣网友沉默如海与知名网红、“创业达人”许豪杰的争端在微博与豆瓣上闹得沸沸扬扬,作为一名python业余选手,用程序带大家看看到底网友们是如何看待许豪杰的。

背景

北京时间2017年7月16日,一篇名为《怎么能想到我喜欢的微博大v段子手竟然是恋童癖!!...》的文章在豆瓣上发布,疑是曝出知名网红,“创业之神”,安徽卫视《超级演说家》季军得主许豪杰为恋童癖。
随后,7月22日,许豪杰发布一条微博予以回击,这条微博截止2017年8月1日已被转发12838次,评论32895条。接下来网游们都说了什么?

数据抓取

笔者用python(一门编程语言),抓取该微博评论21270条,(其中剔除了一些网友间互相回复的评论,仅保留对该微博的主观评价)

存储数据

数据分析

这里的数据分析,其实就是对自然语言的分析.会对每条评论进行分词,统计各个词汇出现的频率。

分析数据

并绘制出以下图片,图中字越大表明出现的频率越高。

结论

其中“恶心”一词高居榜首,出现3471次,就是说有3471条评论评价该条微博“恶心”。另外“不要脸”、“变态”、"好丑"也出现频率极高。

注:本文仅分析了微博网友的评论数据,不带表本人的个人观点。最后,我就说恋童癖变咋了😠😡

上一篇下一篇

猜你喜欢

热点阅读