`
chenlb
  • 浏览: 689807 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

solr 分布式(复制)配置

阅读更多

    solr 分布式其实是分发,这概念像Mysql的复制。所有的索引的改变都在主服务器里,所有的查询都在从服务里。从服务器不断地(定时)从主服务器拉内容,以保持数据一致。

先描述下我的环境:
solr-master(192.168.1.181), solr-slave(192.168.1.155), jdke1.6.0_06, tomcat-5.5.26, solr-1.2 
tomcat_home在 /home/chenlb/tomcat-5.5.26
solr_home在 /home/chenlb/solr-home
solr解压后的目录 /home/chenlb/solr-1.2.0
最好两机可以ssh无密码交互,ssh无密码登录请看:http://www.blogjava.net/chenlb/archive/2008/07/03/212293.html

http://chenlb.iteye.com/blog/211809



    solr的分发是用rsync的。
    快照与分发过程:

1.snapshooter 命令在主服务器产生快照。一般在commit和optimize之后被solr调用。

2.snappuller 命令在从服务器运行,所做的事是从主服务器拉最新的快照。 用rsync的daemon模式来运行可以获得更好的性能与更底的CPU利用率。

3.snapinstaller 命令在从服务器运行,当从服务器从主服务器拉完快照后才执行。它会通知本地Solr服务器打开一个新的index reader,然后预热这个新index reader的缓存,此时有请求,原来的index reader继续为这此请求服务。一但预热完成,Solr 启用新的index reader,旧的被消亡。

    Solr 的Distribution(分发) 在Scripts文件里记录。在solr_home/conf/scripts.conf文件里。

我现在这样配置:

user=chenlb
solr_hostname
=localhost
solr_port
=8080
rsyncd_port
=18080
data_dir
=/home/chenlb/solr-home/data
webapp_name
=solr
master_host
=192.168.1.181
master_data_dir
=/home/chenlb/solr-home/data
master_status_dir
=/home/chenlb/solr-home/logs


上面的配置两机都一样。

1.安装好solr后启动它们,怎样在tomcat安装solr请看:http://www.blogjava.net/chenlb/archive/2008/03/25/188459.html

http://chenlb.iteye.com/blog/196489

[chenlb@solr-master ~]$ ./tomcat-5.5.26/bin/startup.sh


启用且启动rsync

[chenlb@solr-master ~]$ ./solr-home/bin/rsyncd-enable -u chenlb -v
[chenlb@solr-master ~]$ ./solr-home/bin/rsyncd-start -u chenlb -v

 

[chenlb@solr-slave ~]$ ./tomcat-5.5.26/bin/startup.sh


2.solr-master
先修改post.sh

[chenlb@solr-master ~]$ cd solr-1.2.0/example/exampledocs/
[chenlb@solr
-master exampledocs]$ vi post.sh
[chenlb@solr
-master exampledocs]$
#把http://localhost:8389/solr/update改下面的
http://localhost:8080/solr/update


提交数据

[chenlb@solr-master exampledocs]$ ./post.sh *.xml


产生快照

[chenlb@solr-master ~]$ ./solr-home/bin/snapshooter -u chenlb -v


说明:由于<listener event="postCommit" class="solr.RunExecutableListener">...</listener>没有设置成功(出现java.io.IOException: Cannot run program "snapshooter" (in directory "solr/bin"): java.io.IOException: error=2, No such file or directory,现在还没解决),可以只能手动生成快照(当然也可以cron)

3.solr-slave
启用快照下拉

[chenlb@solr-slave ~]$ ./solr-home/bin/snappuller-enable -u chenlb -v


拉快照

[chenlb@solr-slave ~]$ ./solr-home/bin/snappuller -u chenlb -v


安装

[chenlb@solr-slave ~]$ ./solr-home/bin/snapinstaller -u chenlb -v



现在可以在solr-slave里看结果了:
http://192.168.1.155:8080/solr/select?q=solr
http://192.168.1.181:8080/solr/select?q=solr

看结果是否一样。

分享到:
评论
7 楼 chmod777 2009-02-11  
chenlb 写道

看看 master的 snapshooter log

原来是我slave 上的master_status_dir设置错了,
害的我把snappuller snapinstaller都看了
6 楼 chenlb 2009-02-11  
看看 master的 snapshooter log
5 楼 chmod777 2009-02-10  
chenlb 写道

这方面没有

问你个问题 我按照你的方法进行了部署,并且第一次调用snappuller时,没什么问题。
master和slave都可以查询到。
但是再往master中加入新的记录以后,然后调用snapshooter,并且创建成功,
然后在slave中调用snappuller,会出现
‘no new snapshot available on 192.168.1.125 in /opt/local/solr/data’提示。
这是什么原因啊?
4 楼 chenlb 2009-02-10  
这方面没有
3 楼 chmod777 2009-02-10  
好文章!问下,您研究过solr + apache 的并发性能吗?
2 楼 happy_fish100 2008-08-06  
分布式文件存储可以试试FastDFS,一个开源的轻量级分布式文件系统,用纯C编写,提供了C和JAVA Client API。
详情请参阅:http://www.csource.org
google code下载地址:http://code.google.com/p/fastdfs/downloads/list
1 楼 SeanHe 2008-07-05  
谢谢楼主的好文章

相关推荐

    SOLR的应用教程

    1.6 分布式和复制 Solr 架构 13 2 Solr的安装与配置 13 2.1 在Tomcat下Solr安装 13 2.1.1 安装准备 13 2.1.2 安装过程 14 2.1.3 验证安装 15 2.2 中文分词配置 15 2.2.1 mmseg4j 15 2.2.2 paoding 19 2.3 多核...

    Solr全攻略

    Solr可以使用Zookeeper实现简易分片和复制,统一配置。为了提高查询速度和处理更多的文档,Solr可以通过索引分片来实现分布式查询。为了提高吞吐量和容错能力,可以为每个索引分片增加副本,同时,把所有的索引复制...

    docker-solr:用于Solr的Docker构建,用于管理官方Docker Hub solr映像

    Apache Solr具有高度的可靠性,可扩展性和容错性,可提供分布式索引,复制和负载平衡查询,自动故障转移和恢复,集中式配置等。 Solr为许多世界上最大的互联网站点提供搜索和导航功能。 在和《 了解更多信息。 ...

    【xbin-store】模仿国内知名B2C网站,实现的一个分布式B2C商城

    模仿国内知名B2C网站,实现的一个分布式B2C商城 使用Spring Boot 自动配置 Dubbox / MVC / MyBatis / Druid / Solr / Redis 等

    使用Python操作Elasticsearch数据索引的教程

    Elasticsearch是一个分布式、Restful的搜索及分析服务器,Apache Solr一样,它也是基于Lucence的索引服务器,但我认为Elasticsearch对比Solr的... 分布式:Solr Cloud的配置比较复杂。 环境搭建 启动Elasticsearch,访

    Hbase 二级索引方案

    Solr 是高度可扩展的,并提供了分布式搜索和索引复制。Solr 4 还增 加了 NoSQL 支持,以及基于 Zookeeper 的分布式扩展功能 SolrCloud。SolrCloud 的说明可 以参看:SolrCloud 分布式部署。它的主要特性包括:高效、...

    Eclipse开发分布式商城系统+完整视频代码及文档

    ├─补充2:Redis3.0新特性、主从复制、集群视频教程 │ │ 打开必读.txt │ │ │ ├─相关资料 │ │ redis-3.0.1.tar.gz │ │ redis-3.0.2.tar.gz │ │ redis-3.2.1.gem │ │ Redis集群.docx │ │ ...

    HBase视频教程下载|基于微博数据应用的HBase实战开发

    课时12:Observer协处理器实战之表复制应用实战 课时13:Endpoint协处理器实战之原理剖析 课时14:Endpoint协处理器实战之数据统计应用实战 课时15:使用API管理HBase之核心理论 课时16:使用API管理HBase之编程...

    t淘淘商城项目 商城项目 视频和源码教程 详细

    不使用maven:工程部署时需要手动复制jar包。完成工程构建。非常繁琐。 使用maven进行工程构建: 使用maven可以实现一步构建。 3.3.1. 后台管理系统的工程结构 继承: 依赖: 后台管理系统工程结构...

    一个适合新手学习的电商项目

    1、tomcat做集群配置session复制。如果集群中节点很多,会形成网络风暴。推荐节点数量不要超过5个。 2、分布式架构。拆分成多个子系统。(本项目使用) ### shop-order(订单系统) * 当用户提交订单时此时必须...

    JAVA上百实例源码以及开源项目

     Java二进制IO类与文件复制操作实例,好像是一本书的例子,源代码有的是独立运行的,与同目录下的其它代码文件互不联系,这些代码面向初级、中级Java程序员。 Java访问权限控制源代码 1个目标文件 摘要:Java源码,...

    JAVA上百实例源码以及开源项目源代码

     Java二进制IO类与文件复制操作实例,好像是一本书的例子,源代码有的是独立运行的,与同目录下的其它代码文件互不联系,这些代码面向初级、中级Java程序员。 Java访问权限控制源代码 1个目标文件 摘要:Java源码,...

Global site tag (gtag.js) - Google Analytics