ES的安装
下载安装
https://www.elastic.co/downloads/past-releases 官网的现在下载页面。进入以后选择对应的产品和版本进行下载。
不要打开中文版,几乎所有链接都会定位到广告页面,无法获取有用信息。
截止2019-05-10,最新的java版本的ES依赖只支持到6.x,而最新版本的ES已经到7.x。要注意版本对应,否则java和ES交互的时候会报错,版本不兼容。
image.png
启动
下载并解压完毕以后,会出现elasticsearch-6.4.3
文件夹,点击bin/elasticsearch.bat
启动ES。启动完成以后,访问http://localhost:9200/
,出现以下JSON即为启动安装成功。
{
"name": "0Fj5Yyx",
"cluster_name": "elasticsearch",
"cluster_uuid": "qRoTkxTESm6FZ0jGI-9UcQ",
"version": {
"number": "6.4.3",
"build_flavor": "default",
"build_type": "zip",
"build_hash": "fe40335",
"build_date": "2018-10-30T23:17:19.084789Z",
"build_snapshot": false,
"lucene_version": "7.4.0",
"minimum_wire_compatibility_version": "5.6.0",
"minimum_index_compatibility_version": "5.0.0"
},
"tagline": "You Know, for Search"
}
分词器安装
什么是分词器
分词器是将存储进去的文档进行短语拆分处理,用来作为查询索引。比如要在es中存储“人民币”,默认的分词器会将这个词语进行拆分,分为“人”,“民”,“币”。查询时输入“人”,“民”,“币”三者中的一者都会关联出“人民币”这个内容。
为什么需要自定义分词器
原生的分词器对于中文的分词支持不是很好。原生中文不支持短语分词,而是将中文一个一个的拆分。比如:“人民币”,原生的分词器会将其分为“人”,“民”,“币”。这时你只想查询人相关信息的时候,“人民币”也会被关联出来。索引出了很多相关不大的结果,降低了查询质量。
比较好的中文分词器
IK分词器(https://github.com/medcl/elasticsearch-analysis-ik)。
该分词器的作者之前所属公司是医疗行业,为了公司商品还有其他一些查询需要,用了ES进行检索。当时也是受限于原生分词器对中文支持不好的诟病,遂自己实现了一套分词器。
安装IK分词器
在https://github.com/medcl/elasticsearch-analysis-ik/releases 页面中下载对应ES版本的分词器,将其解压放在$ES_HOME/plugin/ik
目录下,重启es,分词器插件就自动加载了。
小结:
至此ES安装告一段落,目前启动依靠的还是默认配置,IK分词器也可以自定义分词,这些留着后面研究。
java客户端
1. 首先导入Maven依赖:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-elasticsearch</artifactId>
<version>2.1.4.RELEASE</version>
</dependency>
- 在
SpringBoot
启动类上加上@EnableElasticsearchRepositories
注解,装配ES的核心类 - 创建一个商品类:
GoodsInfo
@Data
@ToString
@NoArgsConstructor
@AllArgsConstructor
@Document(indexName = "products",type = "good", shards = 1,replicas = 0)
public class GoodsInfo implements Serializable {
@Id
private Long id;
@Field(type = FieldType.Keyword)
private String name;
@Field(type = FieldType.Text, analyzer = "ik_max_word")
private String description;
}
注:
@Document
是ES的注解,将此实体类标注成一个文档:
indexName
: 索引名称,相当于数据库
type
: 类型, 相当于表
shards
: 分片数量
replicas
: 副本数量
@Id
作用在成员变量,标记一个字段作为id主键
@Field
作用在成员变量,标记为文档的字段,并指定字段映射属性:
type
:字段类型,是枚举:FieldType,可以是text、long、short、date、integer、object等
analyzer
: 分词器名称,这里的ik_max_word
即使用ik分词器
创建DAO层:
@Component
public interface GoodsRepository extends ElasticsearchRepository<GoodsInfo,Long> {
}
创建Controller层:
@RestController
public class GoodsController {
//每页数量
private Integer PAGESIZE = 10;
@Autowired
private GoodsRepository goodsRepository;
//http://localhost:8888/save
@GetMapping("save")
public String save(@RequestBody GoodsInfo goodsInfo) {
goodsInfo.setId(System.currentTimeMillis());
goodsRepository.save(goodsInfo);
return "success";
}
//http://localhost:8888/delete?id=1525415333329
@GetMapping("delete")
public String delete(long id) {
goodsRepository.deleteById(id);
return "success";
}
//http://localhost:8888/update?id=1525417362754&name=修改&description=修改
@GetMapping("update")
public String update(long id, String name, String description) {
GoodsInfo goodsInfo = new GoodsInfo(id,
name, description);
goodsRepository.save(goodsInfo);
return "success";
}
//http://localhost:8888/getOne?id=1525417362754
@GetMapping("getOne")
public GoodsInfo getOne(long id) {
Optional<GoodsInfo> goodsInfo = goodsRepository.findById(id);
return goodsInfo.get();
}
//http://localhost:8888/getGoodsList?query=商品
//http://localhost:8888/getGoodsList?query=商品&pageNumber=1
//根据关键字"商品"去查询列表,name或者description包含的都查询
@GetMapping("getGoodsList")
public List<GoodsInfo> getList(Integer pageNumber, String query) {
if (pageNumber == null) {
pageNumber = 0;
}
//es搜索默认第一页页码是0
SearchQuery searchQuery = getEntitySearchQuery(pageNumber, PAGESIZE, query);
Page<GoodsInfo> goodsPage = goodsRepository.search(searchQuery);
return goodsPage.getContent();
}
private SearchQuery getEntitySearchQuery(int pageNumber, int pageSize, String searchContent) {
FunctionScoreQueryBuilder functionScoreQueryBuilder = QueryBuilders.functionScoreQuery(QueryBuilders.matchPhraseQuery("name", searchContent));
// 设置分页
Pageable pageable = new PageRequest(pageNumber, pageSize);
return new NativeSearchQueryBuilder()
.withPageable(pageable)
.withQuery(functionScoreQueryBuilder).build();
}
}
在properties文件中指定ES的api地址:
spring.data.elasticsearch.cluster-nodes=127.0.0.1:9300