elasticsearch-7.16.2 安装过程和中文分词
2022-01-06 本文已影响0人
百里有声
下载 7.16.2版本(elasticsearch-7.16.2-windows-x86_64.zip)
解压缩到自定义目录
image.png
下载 ik 分词插件,选择和es一样的版本(elasticsearch-analysis-ik-7.16.2.zip)
es下的plugins目录建立ik文件夹,并将下载的ik解压缩到这里
image.png
启动es(无需任何其他的配置)
image.png
image.png
上图表明ES采用了自己的Java版本
image.png
image.png
postman 分词测试(Post 方式 _analyze 接口,默认为ES自己标准的分词器)
image.png
采用ik分词 ik有多个分词器 Analyzer: ik_smart , ik_max_word
image.png
修改方式
image.png
自定义分词,到(..\plugins\ik\config)目录下建立custom文件夹里面包含一个mydict.dic文件
image.png
mydict.dic文件内容为:
世界有
那么多人
image.png
IKAnalyzer.cfg.xml 文件内容为:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
重启 es 继续调用分词接口
image.png
分词结果变化
image.png