搜索引擎篇(熟练为主,不会很深)

2021-04-19  本文已影响0人  吃掉夏天的怪物

https://www.bilibili.com/video/BV1yv41187tV?p=6&spm_id_from=pageDriver
P6

一、什么是倒排索引?有什么好处?

索引: 从ID到内容
倒排索引:从内容到ID。比较适合做关键字检索。可以控制数据的总量。提高查询效率。
文章-->term-->Posting List

搜索引擎为什么比MySQL快?

Lucence 不光维护了term还会对term进行排序生成term dictionary(可以加快搜索)-->term index。对于Posting List 也不是简单的记录文章ID,还记录了在文章中出现的偏移量,权重(常用的一个标准是TFIDF) 。

二、ES了解多少?说说你们公司的ES集群架构

三、 如何进行中文分词?用过哪些分词器?

四、ES写入数据的工作原理是什么?

五、ES查询数据的工作原理是什么?

六、ES部署时,要如何进行优化?

上一篇下一篇

猜你喜欢

热点阅读