java 专题分享

windows 下搭建 solr 5.3

2016-07-04  本文已影响653人  烟雾袅绕

一:下载solr5.3安装包;点击 solr

二:安装

1:解压安装tomcat ,本文中使用 tomcat7.0

    安装路径 :D:\tomcat\apache-tomcat-7.0.40

2:解压 安装 solr 5.3.1

 本文安装路径:  D:\solr\solr-5.3.1

3:将 solr-5.3.1\server\solr-webapp 文件夹底下的 webapp 复制到 tomcat 对应目录底下的 webapps 中,并将文件夹名字改为 solr

   本文路径:D:\tomcat\apache-tomcat-7.0.40\webapps\solr

4:将 solr-5.3.1\server\lib\ext 文件夹底下的lib全部复制到tomcat底下的 solr/WEB-INF/lib/ 中

    本文路径:D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib

5:将solr-5.3.1\server\resources 下的log4j.properties文件复制到tomcat/webapps/solr/WEB-INF/classes目录下,如果该目录不存在则新建。

6:将solr-5.3.1\server 下的 solr 文件夹复制到D:\tomcat\apache-tomcat-7.0.40\bin 目录下 , 这个就是 solr/home(存放的检索数据)

7:设置solr/home , 编辑 D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\web.xml
solr 启动的时候会去这个目录下加载配置信息

    <env-entry>
        <env-entry-name>solr/home</env-entry-name>
        <env-entry-value>D:/tomcat/apache-tomcat-7.0.40/bin/solr</env-entry-value>
        <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

三:启动tomcat http://localhost:9090/solr 查看是否配置成功

四: 添加自定义 solr

  1: 在刚才 定义的  solr/ home 中 新建一个文件夹 core  

      如 本文路径:D:\tomcat\apache-tomcat-7.0.40\bin\solr\core

  2:在core 目录下新建 data 文件夹 ,将 D:\tomcat\apache-tomcat-7.0.40\bin\solr\configsets\basic_configs 目录下的  conf  文件夹复制到  core 目录下

 3:在sorl 控制台 点击 add core          
Paste_Image.png

五:配置中文分词(mmseg4j)

 1:下载jar 包 (mmseg4j-core-1.10.0.jar、mmseg4j-solr-2.3.0.jar),并复制到tomcat底下的 solr/WEB-INF/lib/ 
 这里包貌似不太好找,可以下载 solr-core 包,里面会包含这两个包   

      <dependency>
            <groupId>org.apache.solr</groupId>
        <artifactId>solr-core</artifactId>
        <version>5.3.1</version>
      </dependency>

 2:D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf\schema.xml  新增

  <fieldtype name="textComplex" class="solr.TextField"  positionIncrementGap="100">
    <analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
    </analyzer>
    </fieldtype>
    <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
    </analyzer>
    </fieldtype>
    <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="d:/my_dic" />
    </analyzer>
</fieldtype>

六:java 中调用

1: 在上面说的schema.xml中,添加

   <field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/>

2:新建测试类

// 需要导入 上文中的 solr-core 包即可

public class App 
{
     //solr url
    public static final String URL = "http://127.0.0.1:9090/solr";
    //solr应用
    public static final String SERVER = "my_solr";
    //待索引、查询字段
    public static String[] docs = {"Solr是一个独立的企业级搜索应用服务器",                               
                                    "用户可以通过http请求",
                                     "向搜索引擎服务器提交一定格式的XML文件生成索引",
                                    "也可以通过Http Get操作提出查找请求"};
 
    public static SolrClient getSolrClient(){
        return new HttpSolrClient(URL+"/"+SERVER);
    }
    
    /**
     * 新建索引
     */
    public static void ctIndex(){
        SolrClient client = getSolrClient();
        int i = 0;
        List<SolrInputDocument> docList = new ArrayList<SolrInputDocument>();
        for(String str : docs){
            SolrInputDocument doc = new SolrInputDocument();
            doc.addField("id",i++);
            doc.addField("content_test", str);
            docList.add(doc);
        }
        try {
            client.add(docList);
            client.commit();
        } catch (SolrServerException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    };
    
    /**
     * 搜索
     */
    public static void search(){
        SolrClient client = getSolrClient();
        SolrQuery query = new SolrQuery();
        query.setQuery("content_test:搜索"); //搜索
        QueryResponse response = null;
        try {
            response = client.query(query);
            System.out.println(response.toString());
            System.out.println();
            SolrDocumentList docs = response.getResults();
            System.out.println("文档个数:" + docs.getNumFound());
            System.out.println("查询时间:" + response.getQTime());
            for (SolrDocument doc : docs) {
                System.out.println("id: " + doc.getFieldValue("id") + "      content: " + doc.getFieldValue("content_test"));
            }
        } catch (SolrServerException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
    
    public static void main(String[] args) {
        ctIndex();
        search();
    }
}

3:查看执行结果

// 其中找到 带"搜索" 的 文档个数 2个
{responseHeader={status=0,QTime=7,params={q=content_test:搜索,wt=javabin,version=2}},response={numFound=2,start=0,docs=[SolrDocument{id=0, content_test=[Solr是一个独立的企业级搜索应用服务器], _version_=1538905774611234816}, SolrDocument{id=2, content_test=[向搜索引擎服务器提交一定格式的XML文件生成索引], _version_=1538905774615429120}]}}

文档个数:2
查询时间:7
id: 0      content: [Solr是一个独立的企业级搜索应用服务器]
id: 2      content: [向搜索引擎服务器提交一定格式的XML文件生成索引]

七: 与数据库整合
1: 以mysql作为示例。找到 D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf\ solrconfig.xml 新增以下代码

// 特别注意 : 这里需要在 D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib 下导入  solr-dataimporthandler-5.3.1.jar

<!--这个主要用来导入数据库 的配置文件-->
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">  
      <lst name="defaults">      
            <str name="config">data-config.xml</str> 
      </lst>
</requestHandler>

2: 在D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf 下新建 data-config.xml 文件

  <?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
  <!--这里配置自己的数据库信息-->
<dataSource name="solrDB" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/demo" user="root" password="123456" batchSize="-1" />
    <document>
        <entity name="student" dataSource="solrDB" query="SELECT * from student">
            <field column="stuId" name="id" />
            <field column="stuName" name="stuName" />
            <field column="age" name="age" />
            <field column="sex" name="sex" />
        </entity>
    </document>
</dataConfig>

3: 修改 D:\tomcat\apache-tomcat-7.0.40\bin\solr\my_solr\conf\schema.xml ,新增如下代码

<!--这里的name  注意和上面的配置 对应-->
<field name="stuName" type="string" indexed="true" stored="true" multiValued="true"/>
<field name="age" type="int" indexed="true" stored="true" />
<field name="sex" type="string" indexed="true" stored="true" />

4:打开solr 控制台 ,点击左侧菜单“Dataimport“,默认勾选项即可,点击”Excute“按钮,这时会按照刚才的配置导入相应的数据到solr中 ,这里貌似不会自己刷新,你可以点击下面的 Refresh status 查看是否导入完成, 同时你也可以在 左侧导航栏, Logging 中查看导入日志

Paste_Image.png

5:导入成功以后,可以点击左侧导航栏 Query ,在Q 栏中输入 字段 :值, 进行查询

Paste_Image.png
上一篇下一篇

猜你喜欢

热点阅读