nutch2.2.1与solr4.5.1的整合

2016-04-05  本文已影响498人  trieyouth

前言

这是看到nutch可以跑起来的最后一步,加油!

solr的下载

本来我还是想上传CSDN的,但是看了看100多M,还是算了吧。

运行solr

解压solr后,进入${SOLR_HOME}/example,运行start.jar

java -jar start.jar

验证solr是否启动成功

进入java http://localhost:8983/solr,看到如下页面说明启动成功

截图

nutch整合solr

将${NUTCH_DIR}/conf/schema-solr4.xml拷贝到${SOLR_DIR}/example/solr/collection1/conf/并重命名为schema.xml,在fields域里最后添加一行

<field name="_version_" type="long" indexed="true" stored="true" multiValued="false"/>

重启solr

关闭solr的终端,重新打开一个终端,运行java java -jar start.jar

验证nutch

创建urls/seed.txt,seed.txt里应该写点啥自便吧,运行java ./nutch inject urls/seed.txt

预告

下一篇<a>nutch2.2.1与hbase1.1.1的坑爹版本问题</a>

上一篇下一篇

猜你喜欢

热点阅读