1 初识elasticsearch 介绍篇
做什么东西,相信大家都会事先了解这个东西是什么,能干什么,为什么要用它,其它方式不行么,...等等一系列的问题,当然博主也不例外。注:如果您已经了解过了,不想浪费时间,那么可以关注后续系列,会让您得到意想不到的效果哦,但是还是建议您看看,或许不一样。
本系列主要以短篇形式讲解elasticsearch 从初识——入门——深入——实战,尽量不耽误读者太多时间,长时间大篇幅不利于吸收掌握,所以我将以小篇幅介绍强悍的es搜索引擎。
不说废话了,进入初识elasticsearch 吧。
Elasticsearch是一个基于Lucene的开源搜索引擎,对于大部分开发者而言(当然也包括博主啦),Lucene并不好用,但并不能阻碍它成为迄今为止最先进、性能最好、功能最全的搜索引擎库。因此Elasticsearch自然而言就诞生了。
Elasticsearch 为何如此火呢?
- 简单的restful api,天生的兼容多语言开发
- 分布式的实时文件存储,每个字段都被索引且可用于搜索
- 分布式的实时分析搜索引擎,海量数据下近实时 秒级 响应
- 易扩展,处理PB级结构化或非结构化数据
说说Elasticsearch能干啥吧?
- 搜索引擎、数据分析引擎
搜索 :google、百度、360,论坛站内搜索,传统系统的关键字检索
分析:电商平台的XXX热门排行榜,视频网站的xxx出轨门的访问量排行,内容媒体站点的近xx天的关注量内容类别。
- 全文检索,结构化检索,数据分析
全文检索:搜索 "出轨门" 关键字,匹配数据
结构化检索:根据 "type" 快速获取某分类数据信息
部分匹配、自动完成、搜索纠错、搜索推荐
数据分析:获取分类下商品数量等等。
- 海量数据近实时处理
分布式:自动将海量数据分散到多台服务器上去存储和检索
近实时处理:多节点计算大大提高计算性能
Elasticsearch应用场景
- 内容系统:百度百科、维基百科、今日头条、搜狐新闻...
- 论坛:开源中国、csdn、stack overflow...
- 代码库:github、coding、oschina git...
- 电商平台:jd、tmall、ebay...
- 日志平台:elk...
以上都可以联系elasticsearch ,但是具体还看公司。。。
Elasticsearch特点
- 既可以大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公司;也可以运行在单机上,服务小公司
- 对开发者而言,是开箱即用的,非常简单,简单部署,操作简单。
- 作为传统数据库的一种补充,传统数据库的功能面对很多领域是不够用的(事务,还有各种联机事务型的操作);特殊的功能,比如全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理
今天介绍的差不多了,这些东西网上太多了,所以就简单概括吧。
以上就是本章内容,如有不对的地方,请多多指教,谢谢!
为了方便有需要的人,本系列全部软件都在 https://pan.baidu.com/s/1qYsJZfY
下章预告:主要讲解 2 elasticsearch安装及名词解析、架构
作者:逐暗者 (转载请注明出处)