了解搜索引擎的工作机制
2019-02-23 本文已影响1人
b488d1204bc9
提到百度,很多人都知道他的搜索功能,网上流传一句话:“有问题找度娘”,百度搜索是全球最大的中文搜索网站,据第三方官方数据统计,百度移动端及PC端的市场份额总量达73.5%,覆盖了中国97.5%的网民,拥有6亿多的用户。
百度这么大的覆盖范围,他究竟是一个怎样的工作原理呢?
说到百度,其实它是多个商业产品做出来的一个综合的数据,它有很强大的记忆功能,通过多个产品的综合,它的数据是非常强大的,如果说一些平台的数据是2d、3d,那百度这里的客户可以是5d、6d甚至更多,它是更加全面的。
这里先说说大家都知道的百度搜索引擎的工作原理,大家可以看下面这张图:
首先,百度搜索引擎会派出“蜘蛛”抓取页面,比如说我们之前已经在其他平台发布了一些文章,就会被蜘蛛抓取,随后将网页放入原始页面数据库,这个时候计算机就会进行筛选,丢弃掉一些不符合规则的网页,比如说抄袭文章、采集或者复制的内容。剩下的符合规则的内容就会被放入百度的搜索引擎数据库。
这时候,如果用户过来搜索内容,计算机就会分析用户的搜索请求,在索引数据库里寻找相对应的网页,根据关键词、权重等,计算排列顺序,最后把结果展示给用户。
以上就是百度搜索引擎的工作原理,想了解更多内容,可以持续关注:安欣蓉CW