算法是个什么鬼,今日头条爆文来的,推荐机制了解一下
关于今日头条,很多人刚做自媒体的新手都在奇怪:
有的账号粉丝过万写一篇文不温不火,
有的账号没啥关注一篇冷门领域爆文十万阅读。
问自媒体老司机,这个平台为啥这么神奇呢?他们都是嘿嘿一笑,然后讳莫如深的撇下一句。“算法,算法不同”。
今日头条算法的未解之谜到底是啥?今儿,一起解密今日头条的算法机制。
1).今日头条平台优势
相对于微博和公众号,今日头条的算法特性在于,内容的极度去中心化。
对于微博而言,明星账号是热点内容的发起点,即使是一个普通的微博账号,也是一个小中心。它们发布内容的阅读量,可以直接被粉丝数量所左右。
塘主发了个微博,他的几千万小迷妹第一时间就会收到。小迷妹关心的是塘主又发博了。
娘娘发了个微博,她的几千万关注者也会第一时间收到。关注者关心的是娘娘又发博了。
但是在今日头条稍有不同,
内容生产者发布的内容,首先要被算法识别和推荐,然后再分发给用户。
在今日头条没有KOL,没有明星账号。用户更加注意获取内容的效率和内容的精准性。
细心的你会发现
微博增强了用户中心化趋势。
头条是极度的去中心化趋势。
所以,你会看到再差的内容在微博里都会有基础阅读量,而在头条号里会被算法过滤,很难有阅读。然而,如果微博粉丝少,好的内容没人看,但在头条号里就会有很多人阅读。
2).今日头条算法概况
今日头条算法的基础公式是:Y=F(Xi,Xu,Xc),我来解释一下:今日头条算法的本质是解决用户和环境、内容之间的匹配性问题。
算法基础维度有三个方面:
1.内容
今日头条是一个全内容平台,文字、图片、视频、小视频啥都有,每种内容还有自己的调性。所以在算法运作时候要考虑到内容特征。
2.用户
显性的看:你什么爱好,你是男是女,你干什么的,你90后还是00后,
隐性的看:你的翻阅记录,你最近的打开频次,你的平均阅读时长,
每一个用户都有自己独特性,但同时在某个维度下又有共同性。所以在算法运作时候要考虑到用户特征。
3.环境
这是移动信息时代的特点,上班的路上可能喜欢看些新闻,工作场合喜欢阅读相关知识。旅游去了喜欢查攻略,睡觉前你就爱看段子。
在不同的场景下,你得阅读爱好是会有所偏移的。所以在算法运作时候——要考虑到环境特征。
结合这三个维度
算法会给出预判,预测该内容是否能对某一情景下的某一用户产生正面反馈。其实,不只是今日头条,其他内容平台都是这个尿性。
还有些做自媒体很容易忽略的方法,大基础明白了,我们在聊聊特征。
3).推荐特征
基于算法三维度的大前提,我们可以推导出起码四个推荐特征:
1.匹配性特征
即然算法是用来解决,内容和用户匹配性的,那么精准的内容必然会获得,头条更多的推荐量。
那么关键词、分类、和主题的选择就显得尤为重要。
2.环境特征
即然算法是用来解决,环境和用户匹配性的,那么贴合时间点、贴合地理位置、必然会获得头条更多的推荐量。
3.热度特征
所有用户都在关注的热点会被多推荐
一个类别下(比如娱乐、体育)大热的内容会被多推荐、
一个主题下(比如说:NBA季后赛)大热的内容会被多推荐、
一个关键词下(詹姆斯)大热的内容会被多推荐。
4.是相似性特征
通过用户行为分析,不同用户间相似性,
比如老王和老李都喜欢晚上十点左右看看新闻,都关注了NBA。那么头条给老王推荐的内容有时候也会给老李推荐。
特征明白了,我们再来聊聊实操。
4.)内容角度
1.颗粒度
颗粒度越小的文本,冷启动能力越强,因为,头条的推荐机制中包含了语义标签。
语义标签:
就是文章打上标签。这部分标签是由人定义的特征,每个标签有明确的意义,标签体系是预定义的。所以文章的标签越细,文章就越垂直,冷启动能力就越强。
就好比【NBA】VS【凯尔特人】VS【塔图姆】,关注NBA的人很多,关注凯尔特人的少一些,关注塔图姆的就不多了。这时候你发送一个NBA的文章,系统只会推给NBA下面0.001%的人看。
但是呢,你发送一个塔图姆的文章,系统会推荐塔图姆下面80%的人看。所以越细分的文本的冷启动能力越强。
2.消重机制
保护用户对于相似文章,只先读一篇。一方面这跟刺激感与疲劳感有关,鸡腿好吃一天吃200个你也受不了是不是;
另一方面对于原创作者来说,也是一种保护措施。所以,咱们在操作的时候,首先就要申明原创,
你申明原创成功了那你的文章就会主推荐,看的人自然多。而且搬运工们就被消重啦。但是要是有些手子洗稿比较狠,那没办法它们还是可以绕过算法的。没有申明原创,或者原创未通过,先发优势不大。
根据热度推荐特征,在短期内(比如24小时新闻热点)。算法更相信官方来源(比如新华社、中国青年报);而且标题和图片也会消重。
做一个头条号跟他么写毕业论文一样,也不知道张老板怎么想的。。。。
根据消重机制的原则和语义标签原则,我推测。一个热点事件,大家都从一个角度写。头条算法只会主力推荐其中几篇。
所以,千万要视角独特写出和别人不一样的内容,这样在另一个标签角度下你得文章会得到加权,从而扩大阅读量。
人物、机构
不知道你有没有发现,在今日头条中高阅读的文章,往往与知名人物或机构有观。
果兄告诉你:因为头条的算法在文本特征模块中,除了基础的分类体系(也就是每一个文章必须有一个归类标签)以外。
在它的基础上还有一个“实体体系”,而实体体系的标签就是每个领域热门的人物、机构和作品。所以在头条进行创作,完全可以蹭知名人物、知名公司。
3.从用户角度
在另一个层面,头条推荐机制,也会通过用户反馈进行倒推。
头条官方说法有以下四个特征:
1.过滤噪声
通过记录停留时间短的点击频次,过滤标题党。如果一个文章别人仅仅是点开就退出,那么文章是很难有推荐量的。
2.热点惩罚
对用户在一些热门文章(如前段时间PG One的新闻)上的动作做降权处理。理论上,传播范围较大的内容,置信度会下降。
也就是说,已经传播范围比较大了,那么用户的操作行为(点赞、评论、转发)对于进行更多推荐的影响权重会逐渐变小。
3.时间衰减
用户兴趣会发生偏移,因此策略更偏向新的用户行为。因此,随着用户动作的增加,老的特征权重会随时间衰减,新动作贡献的特征权重会更大。
三年前你喜欢看游戏视频,最近你迷上了维多利亚的秘密,那么头条会大量的给你推荐维多利亚的秘密,而不是英雄联盟小智的解说。
惩罚展现
如果一篇推荐给用户的文章没有被点击,相关特征(类别,关键词,来源)权重会被惩罚。
推荐机制
用头条的老铁都知道,在注册今日头条时,头条就会让你选择感兴趣的内容形成用户画像。在接下来的使用过程中,头条会根据用户行为(点击、转发、搜索、阅读、订阅等)不断升级用户画像。
小明今天看了创造101,明天头条就给你推杨超越的小视频。
小张今天订阅了军事,明天头条就给你推半岛局势详解。
如果你不登陆账号,当个游客,那么头条根据热点原则,就先给你推全局热点内容(大众化内容),再根据你得点击来确定用户画像。
经过审核和消重的文章,会逐渐推送给用户。首先算法会推荐给相关性最高的用户,然后看看他们怎么操作的。根据得到的有效反馈决定之后的推荐数量。点击、收藏、评论、转发、甚至是页面停留的时长都会对下一批推荐量产生影响
那么头条、企鹅、百家,大鱼等平台如做何收益,怎么快速上手,新手怎么快速开原创,如何持久输出原创内容,如何做爆文,我相信这些下面这些资料可以帮到大家,这也是我一路走过来的一些总结。可以看我主页+v 赠人玫瑰手有余香