小数据数字营销

SEO基础之搜索引擎运作原理

2017-09-20  本文已影响59人  xyli晓艳

周围那么多人都不再看好SEO了,但是不知道怎么的,我就开始走到了SEO这条路上,权当是一个学习笔记吧。把这些basic的知识掌握了,至少不容易被形形色色的代理公司忽悠到吧。

这是第一篇基础知识—搜索引擎的运作原理

讲到SEO(Search Engine Optimization)搜索引擎优化,必定是基于自身网站针对搜索引擎的优化过程,因而首先需要搞清楚搜索引擎是怎么运作的。所谓知己知彼,方能做到有的放矢,知其所以然吧。

搜索引擎主要做两个工作:爬行各个网页并建立索引,当用户搜索某个关键词时以排名的方式将相关网页呈现给用户。简言之就两部分:一是爬行和索引,二提供答案。

一爬行和索引

你可以把世界上千千万万的网页想象成一个用链接连接的巨型蜘蛛网(这可能正是万维网这个中文名字的意义所在),搜索引擎的爬虫(蜘蛛)就在这些网页间以链接为路径进行爬行。当然这个爬虫不是一直在某个网页上爬行,每次的爬行会有一定的时间间隔,即爬行频率。各个搜索引擎的爬行频率是不同的,这也会解释为什么有的网页被搜索引擎A收录了,但是搜索引擎B却没有收录,只是因为还没有到爬虫来的时间点而已,这是后话,此处还不展开。

一旦爬虫爬行完某个页面后搜索引擎会建立一个索引,将选中的某些数据存储在数据库中,以备将来提供答案时使用。想想看那么多的页面信息要存储,搜索引擎必定是需要有非常大的数据库需求了,尤其是如果想短时间之内(或许是<0.000000001秒之内)将结果呈现给搜索引擎的用户,那必定是同时要求在世界各地的部署相关的服务器的。

二提供答案

搜索引擎在提供答案时会做两件事:一是将与搜索词相关的网页呈现到结果页面,二是对这些相关网页进行排序,主要依据就是网页与搜索词的相关性与网页的受欢迎程度。这两个步骤就是一般在做SEO时需要尽力去影响的步骤。

所以很自然就会有个问题出来:搜索引擎决定网页与搜索词相关性和受欢迎程度的依据是什么?

很早之前,搜索引擎主要依据网页中包含众多相关搜索词。如今,相比形形色色的SEO作弊技术,搜索引擎也逐步发展出几百个决定相关性的因素。搜索引擎一般会把网页受欢迎程度作为衡量相关度的一个重要指标。从一定程度上来说,这也是非常科学的衡量标准,如果不受欢迎的话自然相关度也是低的。

说到这里就会引入我们听了很久的算法了(Algorithms)。搜索引擎当然不会简单的手动决定网页的相关性和受欢迎程度,所谓技术公司当然是需要用复杂的算法来解决这个问题,既彰显高水平,又在一定程度上避免了主观判断带来的影响(甚至被诉讼,可以参见《傲骨贤妻》第4季第3集)。这个算法真的是相当复杂,而且我们无从得知具体公式,有一件事请肯定的是,搜索引擎用网页相关性决定页面是否出现在搜索结果中,用受欢迎程度决定具体网页在搜索结果中的排名。

接下来希望有机会了解一下主要的索引与排名的影响因素。

上一篇下一篇

猜你喜欢

热点阅读