elasticsearch-7.16.2 安装过程和中文分词

2022-01-06  本文已影响0人  百里有声

下载 7.16.2版本(elasticsearch-7.16.2-windows-x86_64.zip)

选择es版本下载

解压缩到自定义目录

image.png

下载 ik 分词插件,选择和es一样的版本(elasticsearch-analysis-ik-7.16.2.zip)

选择ik版本下载

es下的plugins目录建立ik文件夹,并将下载的ik解压缩到这里

image.png

启动es(无需任何其他的配置)

image.png image.png

上图表明ES采用了自己的Java版本


image.png image.png

postman 分词测试(Post 方式 _analyze 接口,默认为ES自己标准的分词器)

image.png

采用ik分词 ik有多个分词器 Analyzer: ik_smart , ik_max_word

image.png

修改方式

image.png

自定义分词,到(..\plugins\ik\config)目录下建立custom文件夹里面包含一个mydict.dic文件

image.png

mydict.dic文件内容为:

世界有
那么多人
image.png

IKAnalyzer.cfg.xml 文件内容为:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 扩展配置</comment>
    <!--用户可以在这里配置自己的扩展字典 -->
    <entry key="ext_dict">custom/mydict.dic;</entry>
     <!--用户可以在这里配置自己的扩展停止词字典-->
    <entry key="ext_stopwords"></entry>
    <!--用户可以在这里配置远程扩展字典 -->
    <!-- <entry key="remote_ext_dict">words_location</entry> -->
    <!--用户可以在这里配置远程扩展停止词字典-->
    <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

重启 es 继续调用分词接口

image.png

分词结果变化


image.png

参考
ElasticSearch中文分词

上一篇 下一篇

猜你喜欢

热点阅读