【ES-04】CentOS7.6安装IK6.2.2分词器插件
2019-05-13 本文已影响0人
境与界
1、环境同上篇文章
2、使用ElasticSearch-plugin安装
cd kibana-6.2.2
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.0/elasticsearch-analysis-ik-6.2.0.zip
3、查看安装目录
ll plugins/analysis-ik/
# 显示如下内容
total 1420
-rw-r--r--. 1 root root 263965 May 13 09:21 commons-codec-1.9.jar
-rw-r--r--. 1 root root 61829 May 13 09:21 commons-logging-1.2.jar
-rw-r--r--. 1 root root 52572 May 13 09:21 elasticsearch-analysis-ik-6.2.2.jar
-rw-r--r--. 1 root root 736658 May 13 09:21 httpclient-4.5.2.jar
-rw-r--r--. 1 root root 326724 May 13 09:21 httpcore-4.4.4.jar
-rw-r--r--. 1 root root 1805 May 13 09:21 plugin-descriptor.properties
4、测试
image.png
5、自定义词典
cd config/analysis-ik
mkdir custom
vi custom/new_word.dic
# 添加“学习强国”
cat custom/new_word.dic
学习强国
6、更新配置
vim IKAnalyzer.cfg.xml
image.png
4、重启elasticsearch,测试
image.png
ik 带有两个分词器
ik_max_word :会将文本做最细粒度的拆分;尽可能多的拆分出词语
ik_smart:会做最粗粒度的拆分;已被分出的词语将不会再次被其它词语占有
ik_max_word,这种分词会把词句分为最小和各种组合:
举例:我想去少年宫
分词是: 我,想,去,少,年,宫
用户查找的时候,输入任何一个包含的词句都会查找的到记录,
使用ik_smart: 会分词:想去,少年宫
用户输入 少年,会查不到记录。