|
#1
发表于 2007-3-5 14:18 资料 短消息 加为好友
|
redhat cluster配置实例(ZT)
仅在此感谢七月飞雪,我这篇实战+七月飞雪的应该弄好不是问题了吧,其它命令7月飞雪列了很多,我就不重复了.哈哈,看我们两人的文档吧!!
七月飞雪的文档:
http://bbs.chinaunix.net/forum/4/040803/379741.html
测试环境
HP DL560 Xeon 2.0G*4 4G RDRAM 140G*2 RAID 1 QL2310F光纤卡(接存储)
HP 6134 光纤网卡 NC7710 10/100/1000 NIC*2
HP DL560 Xeon 2.0G*4 4G RDRAM 140G*2 RAID 1 QL2310F光纤卡(接存储)
HP 6134 光纤网卡 NC7710 10/100/1000 NIC*2
存储 IBM ESS 800 划分给群集 2个 硬盘使用,分别为LUN0 LUN1
以下步骤在两台机器上,均进行操作
1、正常安装完系统,安装时设置好主机名(ha1/ha2),不要启动激活网卡,不设IP,第一次启动时加载双机软件安装包,
2、解决外接存储的正常访问
加载光纤卡驱动,
在Qlogic网站下载最新驱动qla2x00-v7.00.03-fo-dist.tgz,复制到/root,以下是安装光纤卡命令
#cd /root
#tar -xvzf *.tgz //解压驱动
#cd qlogic // (进入解压后的目录)、
#./drvrinstall
#make all SMP=1 //多CPU使用,单CPU用make all
#make all install
编辑/etc/modules.conf //(原有一行是alias scsi_hostadapter qla2300) 更改如下
alias scsi_hostadapter0 qla2300_conf
alias scsi_hostadapter1 qla2300
options scsi_mod max_scsi_luns=255 //(最末行加入)
保存退出
#cd /
#mkinitrd -f 镜像文件名 内核版本号
(镜像文件名:/boot下的那个用于启动的Ramdisk的镜像名,我的是initrd-2.4.21-4.ELsmp.img)
(内核版本号:我的是2.4.21-4.ELsmp) 如果是多处理器就用SMP的文件,没有就用那个没SMP的文件
备份好/boot下原有的那个镜像文件
拷贝根目录下的那个刚做好的镜像文件到/boot
#reboot
以上做好之后就能在硬件浏览器里看见能访问的硬盘了,注意:看好你的硬盘的设备名。
3、重新手工填写IP.子网掩码,网关,并重新探测硬件地址
主机为,ha1 外网IP为10.244.1.128 内网IP为192.168.10.1
主机为,ha2 外网IP为10.244.1.129 内网IP为192.168.10.2
群集硬盘为sda,sdb,2块硬盘,大小均为35G,。
编辑 /etc/hosts 文件
10.244.1.128 ha1
10.244.1.129 ha2
192.168.10.1 eha1
192.168.10.2 eha2
保存退出
修改 /boot/grub/grub.conf 中的超时参数来指定恰当的 timeout 秒数。 要把间隔设为 3 秒钟,按照以下方式来编辑参数:
timeout = 3
以下是只在一台机器上操作
给共享磁盘分区
#parted //自动选择第一块硬盘进行配置
(parted)mkpart primary ext3 0 100 /sda1
(parted)mkpart primary ext3 100 200 //sda2 以上是分两个至少>10M的分区用于群集信息存储 0 100表示起点容量和终点容量,其差就是分区容量
(parted)mkpart extended 200 33377 //分出扩展分区,33377是我硬盘最大空间
(parted)mkpart logical ext3 200 15200 //sda5 用于应用程序使用的数据存储,大小自定,我的是15000M
(parted)mkpart logical ext3 15200 33377 //sda6第二个应用程序使用的数据存储区
(parted)select /dev/sdb //选择另一块硬盘
(parted)mkpart extended 0 33377 //分出扩展分区,33377是我硬盘最大空间
(parted)mkpart logical ext3 0 15000 //sdb5用于sdb应用程序使用的数据存储,大小自定,我的是15000M
(parted)mkpart logical ext3 15000 33377 //sdb6 sdb上第二个应用程序使用的数据存储区
(parted)quit //退出分区工具
#mkfs.ext3 -j -b 4096 /dev/sda1 //我手册上说是要用裸设备,不需要格式化,不过我是格式化了做的。大家可是试试不格式化sda1和sda2,我阁几天还会去试的
#mkfs.ext3 -j -b 4096 /dev/sda2
#mkfs.ext3 -j -b 4096 /dev/sda5 //用EXT3文件系统格式化应用程序使用的分区(根据用户要求),我用户说要用裸设备,那就给他挂裸设备好了,只要他能用
#mkfs.ext3 -j -b 4096 /dev/sda6
#mkfs.ext3 -j -b 4096 /dev/sdb5
#mkfs.ext3 -j -b 4096 /dev/sdb6
以上操作完成后必须将另一台机器重起以识别分区
以下是两台机器上均进行操作
编辑/etc/sysconfig/rawdevices 文件 加入以下两行:sda1 和 sda2 ,对应上面的 两个至少>10M的分区用于群集信息存储 的分区,其设备号可以在硬件浏览器的硬盘管理中查看
/dev/raw/raw1 /dev/sda1
/dev/raw/raw2 /dev/sda2
保存退出
#service rawdevices start //不重新引导而使 rawdevices 文件中的改变立即生效
点击左下角图标,=> 系统设置 =>服务器设置 =>cluster 启动群集管理器
第一次使用会自动转到配置页面,如果没有
点菜单栏里的群集->配置
在Cluster Name处可以更改你设置集群的名字,在这里我设置为clustertest
然后我们开始添加集群内的成员,点菜单栏->新建(注:此时保证列表处选中Members,才可以出现下面内容)
将两台机器机器名(确定在hosts文件中已经包括)或IP填写进去,确定
在这里选中菜单栏里的cluster->shared state,可以查看裸设备设置,如下图
点击确定继续
然后打开菜单栏clusterdaemon properties出现以下窗口
这个窗口就是集群的守护进程配置窗口,
有一个说明的就是中间的那个滑动条,就是配置服务器探测时间.我设定为10秒。
在clumembd这个窗口里选中Enable Broadcast Heartbeating (我是选的这个,因为我如果选下面的多播地址,我也不知道该填什么)
点击上面菜单页选中cluquorumd 守护进程 配置页面
在Tiebreaker IP中填入能关联到路由器的地址作为仲裁,如果只有2台机器,可以选Ping Interval(我是选下面一项弄好的)
由于我的光纤交换机带路由,所以,我填的网关地址10.244.1.25作为仲裁
也可以看下每页的LOG LEVEL选项,一般都选到WARNING,即只记录警告信息
然后确定保存,回到配置页面下.
选择「服务」活页标签,然后点击「新建」。「服务」对话框就会被显示,如图 2-18所示。
添加服务
给服务一个描述性的「服务名称」来把它从群集中运行的其它服务中区分开来。
调整Check字段中的数量。这个字段设置群集体系检查服务状态的间隔(以秒为单位)。我填的4
指定服务 IP 地址
1. 在群集配置工具的「服务」活页标签上,选择你想配置的服务,然后点击「添加子进程」。
2. 选择「添加服务 IP 地址」,然后点击「确定」。
3. 指定 IP 地址(它必须能被 DNS 解析,但又不是一个运行着的服务的 IP 地址)。
4. 指定子网掩码和广播 IP 地址。
添加服务设备
要为服务指定一个设备,请遵循以下步骤:
1. 在群集配置工具的「服务」活页标签上,选择你想配置的服务,然后点击 「添加子进程」。
2. 选择「添加设备」,然后点击「确定」。
3. 指定一个「设备特殊文件」(例如:/dev/sda5)和挂载点(例如:/test/sda5)。每个设备都必须有一个在群集内独特的设备特殊文件和一个独特的挂载点。可以挂载多个设备,但必须有不同的挂载点.
4. 在「挂载点」字段中指定要挂载设备的目录。这个目录不应该被列在 /etc/fstab 文件中,因为它在服务启动时被自动挂载。
5. 从「文件系统类型」中选择一种文件系统类型。为了群集切换快速,一般选EXT3
6. 你还可以为设备指定「选项」。如果你把「选项」字段留为空白,默认的挂载选项(rw,suid,dev,exec,auto,nouser,async)就会被使用。
7. 选择「强制卸载」来在禁用或重新安置服务之前强行把挂载了指定文件系统的应用程序杀死(当运行应用程序的成员和运行被禁用或重新安置的服务的成员是同一个时)。
8. 结束后,点击「确定」。它会提示你目录不存在,如果加载群集服务会自动创建目录,不管它确定就好.
9. 选择「文件」 => 「保存」来把改变保存到 /etc/cluster.xml 配置文件中。关闭配置窗口,它会提示会初始化共享磁盘,没关系,照做就好
然后我们就要配置linux2了,配置linux2其实很简单,将linux1系统下/etc/cluster.xml文件COPY到linux2的/etc/目录下就可以了
(注:cluster.xml是在安装完两个软件包的时候不会产生,它是在第一次运行redhat-config-cluster命令的时候产生的,和AS2.1里的cluster.conf储存内容相同,只不过换了格式而已。这就是集群主要的配置文件,一定要确保集群上每个节点的此文件都是相同的,另外在redhat的官方文档上强烈警告用户:不要去手动的修改这个xml文件,)
分别在两边终端的状态下执行以下命令
#service clumanager start
系统显示执行成功
或在两台机器的群集管理器的在菜单栏 群集=>启动本地群集守护进程,稍等一会儿,就会出现以下状态
这里就显示cluster配置成功
如果你成功的配置了服务,命令service clumanager status,可以看到4个守护进程都是运行状态,
群集管理器中结点图标如上,状态是活跃,下面是2个服务,能看得到一个是正常,一个是失败,在两台群集管理器中的显示是一致的,如果你只配置了一个服务就只能看到一个哦。
最后在服务里添加clumanager 服务 在机器启动的时候自动运行就OK了。
|
|