程序员大数据

使用Solr为应用提供搜索服务(2)搭建&配置

2016-09-26  本文已影响1064人  简单的土豆

在Solr 5.X以后,无论你是在Windos下还是在Linux下搭建Solr、Solr Cloud的都是极其简单的,因为Solr提供了很多快速搭建脚本并且都包括sh、bat两种版本。

环境

  1. OS:Linux
  2. JDK:1.7
  3. Solr:5.5.3

本文以Solr 5 的最后一个发行版5.5.3作为Solr的版本,因为6.X官方建议的JDK版本是Java 8,下载地址:http://apache.fayea.com/lucene/solr/5.5.3/

快速搭建

//1.下载
$ wget http://apache.fayea.com/lucene/solr/5.5.3/solr-5.5.3.tgz
//2.将它移动到你想要的目录下,操作省略。
//3.解压
$ tar -zxvf solr-5.5.3.tgz
//4.进入solr-5.5.3目录下执行下面命令$ ./bin/solr start
Waiting up to 30 seconds to see Solr running on port 8983 [/]  Started Solr server on port 8983 (pid=24120). Happy searching!
//只需这4步,一个单节点的Solr Server就搭建完成了,端口默认为8983,快去访问它吧!

**./bin/solr **这个脚本非常重要,是官方提供操作Solr的入口脚本,通常我们启动单点的Solr Server只会涉及三个命令,start、stop、status,使用start命令启动时可以通过-s 指定solr home目录,-p 指定端口;使用stop命令关闭时可以使用-p指定要关闭的服务的端口,使用-all关闭所有服务;使用status来查看服务的状态。

下面链接是官方文档对该脚本的说明,最好花几分钟快速浏览一遍。
https://cwiki.apache.org/confluence/display/solr/Solr+Start+Script+Reference

提示:使用./bin/solr 启动的Solr使用内嵌的Servlet容器 Jetty,这也是官方建议的,同时这也和Spring Boot的理念相契合,应用本来就是易于使用的,内嵌容器也将是未来Java Web 应用的趋势。笔者在学习Solr的过程中也翻阅过一些博文,大部分还是使用Tomcat来搭建Solr,笔者对此感到困惑,不过你依然可以使用Tomcat,不过搭建就没有这么简便了~

HTML UI
顺利启动后~访问http://your_server_ip:8983/solr 便可进入Solr 的管理界面,点我查看官方用户界面介绍

更进一步

搭建完成后,我们需要通过Core Admin 来创建一个Core,就是上篇文章所说的那个Core,你可以把它理解为在数据库服务器上创建了一个新的数据库,虽然并不是那么恰当。

Add Core

通常在点击Add Core的时候会报错,因为Solr 在solr-home目录并找不到相应的配置文件,因为我们启动的时候并没有指定solr-home目录,也并没有添加相应的配置文件。

现在我们需要停掉该服务,增加solr-home目录,并添加配置文件后,重新启动它。

//1.先停止先前启动的服务(如果你不使用-p或-all的话默认关闭的就是端口为8983的服务)
$ ./bin/solr stop //2.创建solr-home目录(目录,名字随意~)
$ cd ~$ mkdir solr-home
//3.复制solr.xml配置文件
$ cp solr-5.5.3/server/solr/solr.xml ./solr-home/
//4.复制一份core配置文件
$ cp -rf solr-5.5.3/server/solr/configsets/data_driven_schema_configs/ ./solr-home/
//5.修改core配置文件夹名称(这里使用test-core,稍后创建的core要与之匹配)
$ mv ./solr-home/data_driven_schema_configs/ ./solr-home/test-core
//6.指定solr-home,并启动Solr Server
$ cd ./solr-5.5.3
$ .bin/solr start -s ~/solr-home
Add Core

这时,输入name、instanceDir后就可以创建一个Core了,成功后通过下面的Core Selector便可进入该Core,就像进入数据库服务器,选择DB一样~

Execute Query

点击查询便可进行查询操作,不过现在应该没有索引文档,所以结果为空~

现在我们可以添加一些索引,在添加索引之前,我们要创建一些字段,就像数据库创建一张表需要添加Column一样,添加之前我们看看Solr 已经为我们创建了什么字段,看下图。

Document Field

这些字段统一由managed-schema文件来管理、配置(Solr 5 以前叫schema.xml),它位于solr-home/test-core/conf目录下,通过编辑它便可进行配置,官方字段类型介绍非官方比较好的讲解。
我们可以尝试添加一个文档到索引,就以下面JSON(当然也可以是其他格式)为例。

{'id':'1','author':'李恒名','title':'使用Solr为应用提供搜索服务(2)搭建&配置'}
Add Document

再次查询,便可查询到该文档~

Paste_Image.png

此时有必要简略的说一下查询语法了

  1. q代表查询参数:查询所有,author:李查询作者以李开头的,类似于SQL的Where语句。*
  2. start,rows 分页参数
  3. wt 返回类型
  4. 更多请点击这篇文章查看官方文档

使用分词器

如果没有使用分词器的话,我们要查询标题内包含“服务”这个关键词的文档的话,通常需要这样写title:服务,类似于SQL TITLE LIKE '%服务%',这样显而易见会降低性能。如果可以把“使用Solr为应用提供搜索服务(2)搭建&配置”,拆分为“使用”、“Solr”、“应用”、“提供”等等这样的词汇再进行索引的话,那么我们使用title:服务便可快速索引到该文档,要达到该目的,我们需要为Solr添加分词器,这里我们使用IKAnalyzer作为我们中文分词器的选择,下面是步骤。

  1. 下载JAR包,下载地址(IKAnalyzer2012FF_u2只有该版本在Solr 5.5.3下可以正常工作)。
  2. 想办法将JAR包放入/home/solr/solr-5.5.3/server/solr-webapp/webapp/WEB-INF/lib下(相信你可以做到)。
  3. 编辑managed-schema, 在<schema>标签内添加分词fieldType,并使用它,参考下面代码片段
//配置分词器fieldType
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
//将type改为分词器类型
<field name="title" type="text_ik" indexed="true" stored="true"/>
  1. 重启SOLR
使用中文分词器

至此,单节点Solr 的搭建和配置就到此为止了,由于Solr 提供的是HTTP REST接口,所以我们可以很容易的通过GET请求 访问API 获得JSON/XML响应来使用Solr提供的索引服务。


下篇文章:Solr Cloud

我只是官方文档的搬运工,如果你要使用Solr 强烈建议阅读官方文档,写的非常完善,传送门

上一篇下一篇

猜你喜欢

热点阅读