python大法攻略elasticsearch玩转大数据

elasticsearch搜索引擎简易教程(上)

2017-07-14  本文已影响858人  眼君

安装

elasticsearch是java开发的,所以需要先安装jdk.

安装原版的elasticsearch在官网https://www.elastic.co/products/elasticsearch下载

也可以下载elasticsearch-rtf

https://github.com/medcl/elasticsearch-rtf.git

运行

打开命令行,输入elasticsearch文件夹根目录路径/bin/elasticsearch

运行elasticsearch

不要关闭命令行,打开浏览器,输入127.0.0.1:9200并打开,得到下面的页面

打开监听端口

Head插件

elasticsearch-head这个插件是用于管理数据库的,它的作用类似于Navicat.

>>>git clone git://github.com/mobz/elasticsearch-head.git    #安装插件

之后打开项目的根目录

>>>cd  elasticsearch-head

然后安装对应操作系统的npm

之后安装cmpn,这是淘宝的一个npm镜像,可以加速安装速度

>>>npm install-g cnpm--registry=https://registry.npm.taobao.org

安装完成后,进入elasticsearch-head文件夹根目录,打开命令行,输入命令

>>>cnpm install

>>>cnpm run start

出现以下画面便是安装成功

run start

之后可以在浏览器中输入http://localhost:9100查看

head页面

打开elasticsearch-rtf中config文件夹的elasticsearch.yml这个文件,写入如下配置。需要注意的是,冒号后面有一个空格,千万不要忘了。

elasticsearch.yml

写完配置后保存退出,并重启elasticsearch-rtf和elasticsearch-head,然后在浏览器中重新打开localhost:9100

看到如下画面便是连接成功

连接成功

安装kibana

信息

点击右上角信息,按钮,查看当前elasticsearch-rtf的版本,然后进入kibana官网下载对应版本的插件,然后打开命令行,输入kibana文件夹的根目录路径/bin/kibana运行,直到出现以下页面

kibana

然后打开浏览器,输入http://localhost:5601后,将打开如下页面

kibana

elastsearch概念:

1.集群:一个或者多个节点组织在一起

2.节点:一个节点是集群中的服务器,由一个名字标识,默认是一个随机漫画角色的名字

3.分片:将索引分为多份的能力,允许水平分割和扩展容量,多个分片响应请求,提高性能和吞吐量

4.副本:创建分片的一份或多份的能力,在一个节点失败其余节点可以顶上

elasticsearch              mysql

index(索引)                数据库

type(类型)                     表

documents(文档)          行

fields                             列

倒排索引:

源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引“inverted index”,带有倒排索引的文件我们称为倒排索引文件,简称为倒排索引文件“inverted file”

索引的初始化操作

number_of_shards是指定分片的数量,一旦设置就无法更改

number_of_replicas是指定副本的数量.

如下图,当右边出现两个True时说明初始化成功。

初始化操作

这时打开head插件当浏览器页面,会发现出现了一个对应当索引。

head页面的索引

当然我们可以直接在head页面执行同样的任务

在head页面新建索引

获取索引信息的各种方法

获取索引信息的各种方法

更新索引的信息

变更索引信息

更新索引信息

在索引中创建表并写入信息(注意,不需要先创建表)

在索引中创建表并写入信息

其中job是表名,1是数据ID,然后在head中我们就可以找到这条数据

head页面中显示数据

我们可以通过get查看这条数据

GET数据

当然,我们也可以不指明数据ID,这样系统会自动生成一个ID

不指明数据ID的情况

我们可以在head里查看系统生成的数据ID

系统生成的数据ID

获取特定字段的信息

获取特定字段的信息

获取多个特定字段的信息

获取多个特定字段的信息

修改特定字段的信息

修改特定字段的信息

删除

删除


上一篇下一篇

猜你喜欢

热点阅读