数据告诉你简书上什么文章最受欢迎
引言:这篇文章既能体现简书用户的阅读习惯(你到底喜欢看什么样文章),也能表现简书作者、编辑的选文倾向(什么样的文章才能上首页)。
最近在简书上写了几篇文章,由于写的都比较用心,有幸被选到首页,自己也在看其他的首页文章,突然很好奇到底什么类型的文章在简书更受欢迎,或者说,更受到编辑的欢迎;因为文章被推到首页的流程是:首先要把自己的文章投稿到《首页投稿》,如果符合要求或者文章质量很高,编辑会把文章推荐到首页,你的通知里会显示“你的文章《暴雪的游戏轮回——从产品生命周期看暴雪游戏产品线》被编辑推荐了”,如此如此。
因为作者不是专业做数据出身,所以不会爬数据,当然也看不到简书的后台数据,因此就手工录入了近20小时到三天内的发表的(20小时后文章阅读量、点赞数量、评论数量趋于稳定)首页文章的数据,最后采集了符合条件的42篇文章,虽然数据量比较小,做出来最后结果信度有限,但也会反映出很多问题。那究竟简书上什么文章最受欢迎呢?我们拭目以待。
我与小伙伴将文章分类为7大类,分别是:
1、情感类 2、鸡汤类 3、随笔 4、小说 5、生活实用类 6、IT实用类 7、评论类
首页文章分布结果是情感类8篇,鸡汤类6篇,随笔类6篇,小说3篇,生活实用类10篇,IT实用类2篇(由于都属于实用类,用同一个颜色标注),评论类7篇,饼图如下
不同类别首页文章分布饼图结论一:生活实用类文章和情感类文章在简书主页出现最多
只算文章数量肯定不行,文章受欢迎程度如何评定?我算取了所有文章的阅读量、评论数、喜欢数的平均数,由三个比例(阅读量270:评论数1:喜欢数4)也就是1个评论数的重要性等于270阅读等于4个喜欢数(1评论=270阅读=4喜欢)。由这个比例决定三个数目的权重分别是(阅读量1:评论数270:喜欢数67),文章最终得分=阅读量*1+评论数*270+喜欢数*67。这个公式可能还有改进余地,但是也能比较客观的评价每一篇文章“火”的程度。
各类文章从平均得分柱状图文章“火”的程度 公式:
文章最终得分=阅读量*1+评论数*270+喜欢数*67
由图看出,情感类、鸡汤类文章得分很高,阅读量多,评论数和喜欢数也相对较多,第三名就是生活实用类,IT实用类和评论类文章,很遗憾,我们看到随笔和小说类文章,得分真的很低,不是那么受大家欢迎。当然这也有可能是简书使用人群有关,可能很多来简书看文章的人都是来看情感类细腻的笔触和鸡汤类励志的情节的(非黑)。
结论二:情感类、鸡汤类文章最受简书用户欢迎,随笔和小说最难“火”
简书有字数统计功能,那就有一个很有趣的问题出现,是不是文字越多越受欢迎?还是每个类别各不相同?还是会得出其他结果,我们用文章总价值除以文章字数,得出每个字的价值。
各类文章每字价值表我们发现,生活实用类,鸡汤类文章,写较少的字就可以获得较多关注,但是小说,经常写了很多字,也没多少人看,“太长不看”的现代阅读习惯也许还是难以改变。
结论三:生活实用类,鸡汤类文章篇幅较少也可以获得较多关注,小说处于“太长不看”的窘境
接下来我们要来看看文章是否有图片对文章受欢迎程度的影响。由于简书中有一张图片就可以在标题中显示一张图片,我们更关注标题图片是否能让文章更受欢迎,因此选取1、0变量,1代表有图,0代表没图。进行回归后如下图:
图片对阅读影响的线性回归有图片的文章,文章总得分高,没图片的文章,总得分普遍低,虽然样本数量少,但仍然可以看出这个大趋势,所以想让你的文章更受欢迎?添加图片吧!
结论四:标题有图片的文章更有可能受大家欢迎
文章火不火?题目起的好不好是一个很重要的因素,我和做数据的小伙伴一起给文章的题目吸引人程度打了分(尽量减少个人因素影响),做出回归结果如下:
标题吸引人程度影响回归分析虽然点很分散,但也得出一定的线性关系。题目起的好,分有高有低,但是得分最高的是题目最好的,题目不太吸引人的,分数也有高的,所以说内容还是硬指标。
结论五:标题起的好,文章更可能受大家欢迎,毕竟大家都是标题党
由于数据的问题,我们今天得出的这五个结论,不一定非常非常科学,但还是符合常识的。对于写手们、内容营销者来说,要想自己的文章能得到更多关注,还是要加图片、想个好标题。从主页内容上看,简书可能还是一个偏重情感、内心、随笔的内容社区,这一点和知乎、天涯之类的还是有一定区别的,或许是情感类、鸡汤类写手们的文章相对质量较好,能引起共鸣,或者是简书的编辑们也偏好感性类文章,这统统都是我的猜测,因为有太多因素影响了这些结果。最后要特别感谢我的同事,明道数据分析师徐立的帮助,没有他我也写不出这篇文章来~下图是我们的一个EXCEL表,考究党也别仔细看了,打脸什么的最讨厌啦233333~
我要转型去写情感专栏!转载请注明作者来源,版权问题,绝不姑息。
PS:安卓开发者必知的杂志周刊应该分类到IT实用类中,失误😳