【ES-04】CentOS7.6安装IK6.2.2分词器插件

2019-05-13  本文已影响0人  境与界

1、环境同上篇文章

2、使用ElasticSearch-plugin安装

IK github网站

cd kibana-6.2.2
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.0/elasticsearch-analysis-ik-6.2.0.zip

3、查看安装目录

ll plugins/analysis-ik/

# 显示如下内容
total 1420
-rw-r--r--. 1 root root 263965 May 13 09:21 commons-codec-1.9.jar
-rw-r--r--. 1 root root  61829 May 13 09:21 commons-logging-1.2.jar
-rw-r--r--. 1 root root  52572 May 13 09:21 elasticsearch-analysis-ik-6.2.2.jar
-rw-r--r--. 1 root root 736658 May 13 09:21 httpclient-4.5.2.jar
-rw-r--r--. 1 root root 326724 May 13 09:21 httpcore-4.4.4.jar
-rw-r--r--. 1 root root   1805 May 13 09:21 plugin-descriptor.properties

4、测试


image.png

5、自定义词典

cd config/analysis-ik
mkdir custom
vi custom/new_word.dic
# 添加“学习强国”
cat custom/new_word.dic
学习强国

6、更新配置

vim IKAnalyzer.cfg.xml
image.png

4、重启elasticsearch,测试


image.png
ik 带有两个分词器
ik_max_word :会将文本做最细粒度的拆分;尽可能多的拆分出词语 
ik_smart:会做最粗粒度的拆分;已被分出的词语将不会再次被其它词语占有

ik_max_word,这种分词会把词句分为最小和各种组合: 
举例:我想去少年宫 
分词是: 我,想,去,少,年,宫 
用户查找的时候,输入任何一个包含的词句都会查找的到记录,

使用ik_smart: 会分词:想去,少年宫

用户输入 少年,会查不到记录。
上一篇下一篇

猜你喜欢

热点阅读