Python新世界python热爱者

Python玩转简书钻,简述钻是否对文章权重有影响?结果确实有!

2018-11-28  本文已影响1人  48e0a32026ae

前言

当然在学习Python的道路上肯定会困难,没有好的学习资料,怎么去学习呢?

学习Python中有不明白推荐加入交流群

                号:516107834

                群里有志同道合的小伙伴,互帮互助,

                群里有不错的学习教程!

2018年11月15号,简书迎来大变革,取消了以往的积分制度,换为去中心化的简书钻,每日发放一万简书钻。首先,简书给出了获取钻石的途径:写文点赞,与以往的阅读,评论,点赞,关注,写作都能获取积分(不同操作获取的积分不同)不一样,现在的途径更加简单和方便。其次,也说明了获取钻石的多少取决于用户的投票(钻石越多投票权重越大)。

简书每天都会公布前一天的排名,通过编写代码,获取20181115到20181126的数据,并进行分析。

爬虫

爬虫分析

简书钻的排行采用了异步加载,我们通过找包来获取数据,这里分为文章排名和用户排名,我们单独编写代码和单独存储。

文章排名代码

用户排名代码

这里除了获取排名外,还对用户是否为简书会员(这个在分析中解释)进行了判断。

数据分析

文章TOP10

首先,我们看看获取简书钻最多的前10篇文章。

文章涉及的内容,大部分都是和简书钻的分享有关,因为简书钻是最近才开始运营的,跟着这个热点走,曝光率与投票也会相应的多一些。

文章词云

10篇文章可能看到的还是比较局限,我们看看到底哪些文章更容易上榜。我们采取制作词云的方式,看看哪些关键词是最多的。

通过关键词,我们发现,可以将关键词分为两类:

简书钻相关:

比特币

Fountain(简书合作伙伴)

Poc

社区等

干货相关

文章

笔记

导图(这个是长期霸屏用户使用的title:思维导图实战派_汪志鹏) 初步我们可以分析出:我们结合热点以及自身的行业,是比较容易上榜的(没那么简单。。。)。

用户TOP10

如果只是知道文章title规律,我们这种普通人也是很难上榜的。接下来,我们再通过上榜的用户来分析,看看规律。首先是top10。

这些用户排行靠前,大家可以看看这些用户平时的一个分析作品,学习学习。

霸屏用户

我总共爬取了12天的数据,通过代码发现,很多用户12天都上榜了,这种霸屏用户真的是羡慕嫉妒恨。

'书院的夫子'

,

'linwood'

,

'那個長江'

,

'達士通人'

,

'我是北崖君'

,

'简书钻首席小管家'

,

'宿醉弥生'

,

'乐健君'

,

'思维导图实战派_汪志鹏'

,

'altcoin'

,

'淡月6688'

,

'临湖风徐徐道来'

,

'小尘2016'

,

'我是四海szw'

,

'中本葱老爷爷'

,

'weiblock'

,

'蒋坤元'

,

'且行且影'

,

'荆白'

,

'苍天鸭'

,

'脸谱大叔'

,

'肆月初陆'

,

'币圈Tesla'

,

'无戒'

,

'段维Tina'

,

'紫萤石'

,

'陈天宇123'

,

'Jianan嘉楠'

,

'春木sky'

,

'梦之蓝色'

,

'杀个程序猿祭天'

,

'霖山'

,

'雪球薅羊毛'

,

'Carykive'

,

'木木大木木'

,

'大琦有钻'

,

'李砍柴'

,

'杰夫1'

,

'写手圈'

,

'静夜思007'

简书会员or非会员

在前文说到过,获取的钻石很大情况下取决你先拥有的简书钻,简书尊享会员就会拥有很多的简书钻,这也就导致上榜人数中,简书会员的比重占了一大部分。

总结

结合简书钻热点上榜高

你难道不考虑下简书尊享会员么?

自身的努力也很重要,坚持写作,分享干货,这就是简书。

上一篇 下一篇

猜你喜欢

热点阅读