IBM AIX系统操作手册 V5.2使用指南-2
时间:2007-04-27 来源:h18myth
第五章 RS6000 更换硬盘的过程
HDISK0和HDISK1做成MIRROR,是ROOTVG
#mirrorvg rootvg hdisk0 hdisk1
先做系统备份
tctl –f /dev/rmt0 rewind
smitty mksysb
查看HDISK0的S/N,P/N号等,在换盘的时候做对照
lscfg –vl hdisk0
#lscfg -vl hdisk0
DEVICE LOCATION DESCRIPTION
hdisk0 11-08-00-2,0 16 Bit LVD SCSI Disk Drive (36400
MB)
Manufacturer................IBM
Machine Type and Model......IC35L036UCDY10-0
FRU Number..................00P3831
ROS Level and ID............53323154
Serial Number...............E3V59K0B
EC Level....................H32224
Part Number.................08K0293
Device Specific.(Z0)........000003029F00013A
Device Specific.(Z1)........07N4972
Device Specific.(Z2)........0068
Device Specific.(Z3)........02305
Device Specific.(Z4)........0001
Device Specific.(Z5)........22
Device Specific.(Z6)........**********
查看物理卷
lspv 查看逻辑卷组
lsvg
查看在用的逻辑卷组
lsvg –o
# lsvg -o
orclvg
rootvg
# 查看所有硬盘(包括逻辑盘)的状态
# lsdev -Cc disk
hdisk0 Available 11-08-00-2,0 16 Bit LVD SCSI Disk Drive
hdisk1 Available 11-08-00-4,0 16 Bit LVD SCSI Disk Drive
#
查看7133磁盘柜硬盘状态
lsdev –Cc pdisk
停HACMP
smitty clstop
使用lsvg –o 命令会看不到一些(应用)VG(1号机会接管);使用 netstat –ir命令可以看到系统SVC地址会变成BOOT地址 把HDISK0从ROOTVG中不做MIRROW
unmirrorvg rootvg hdisk0
查看物理卷
lspv
这时HDISK0不在和HDISK1为MIRROR
把hdisk0从rootvg中去除
reducevg rootvg hdisk0
在HDISK1上创建boot image
bosboot –ad hdisk1
改变启动设备的顺序
bootlist –m normal hdisk1 cd0
删除HDISK0
rmdev –l disk0 –d
lspv
lscfg –vl hdisk0
以上2条命令不会显示HDISK0的相关信息
关机
shutdown –F
把2号机的外设机箱取出,更换硬盘。注意要标好各电缆的位置
开机 lspv
发现多出HDISK4,而我们需要的是HDISK0
删除HDISK4
rmdev –l hdisk4 –d
cfgmgr
lspv
发现多出HDISK0,HDISK4,可能是我前面删除HDISK0,没有做cfgmgr的原因
删除HDISK4,HDISK0
rmdev –l hdisk4 –d
rmdev –l hdisk0 –d
cfgmgr
lspv
好了,HDISK0出现了
把HDISK0加到ROOTVG中并做镜像
extendvg rootvg hdisk0
做MIRROR
mirrorvg –c 2 rootvg
查看PV
lspv
OK
在HDISK0,HDISK1上创建boot image
bosboot –ad hdisk0
bosboot –ad hdisk1
改变启动设备的顺序
bootlist –m normal hdisk0,hdisk1 cd0
重启动2号机
shutdown –Fr
关闭1号机的HACMP
Smitty clstop
重启动1号机
shutdown –Fr
启动1号机的HACMP
smitty clstart
启动2号机的HACMP
smitty clstart
一切OK
注意
可观察CLUSTER的启动:/usr/es/adm/cluster.log, /tmp/hacmp.out
CLUSTER的版本 lslpp –l|grep cluster
网络的状态 netstat -ni
第六章 HACMP安装配置
准备工作
HACMP相应安装CD。
AIX安装CD。
RM0X补丁CD或最新download的补丁。
SSA Adapter和Disk的微码。
www.hursley.ibm.com/ssa/rs6k/
IP地址。
VG、LV、FS用于HA的配置计划。
了解跑什么应用,Start/Stop Script应该怎么写。 . 确认7133阵列、8port卡和心跳线已连好,机器启动完毕 . 检查每台机器上是否都找到了所有硬盘
lspv
lsdev –Cc disk
如果某台机器没有找到共享硬盘,可用cfgmgr命令。
cfgmgr . 给系统添加TTY
如果安装了8port卡,一共应该有sa0 ~ sa4共5个tty,依次(0 ~ 4)安装。
smitty tty à Add a TTY à rs232 à saX à Port Number: 0 NOTES:
如果使用串行口连心跳线,只能用sa3(即串口4)。
串口4一般位于4个串口的右下一个。
检测连8port卡的TTY
在两台机器上同时运行:
stty < /dev/tty0
这时应该有信息显示。 . 安装Bundle: App_Dev; Client, Server
smitty easy_install
使用AIX安装CD安装文件
smitty installp à Line 1
选择: bos.dosutility
bos.data
X11.vsm* (只在装HA时选择了vsm包时需要) . 安装Base Document
smitty installp à Line 1
选择: bos*; perfagent* 安装系统补丁
使用AIX UPDATE CD
选择: bos.adt* 修改.profile和.dtprofile文件
修改: .dtprofile: DTSOURCEPROFILE=true
.profile: export PS1=’[’`hostname`’:$PWD]’ 修改电源管理
lscfg –vpl pmc0
应该有显示。
smitty pm à Line 2 à Line 2 (Unconfig)
Netscape安装和配置
确认Netscape已安装。
确认docsearch可以运行。
这是基于Netscape的AIX帮助系统。
建立/.netscape文件系统,大小约为10M。 安装HACMP/ES软件
放入HACMP/ES光盘:
smitty installp à Line 1
选择: cluster.adt.es
cluster.doc.en_US
cluster.doc.en_US.es
cluster.es
cluster.es.clvm (for HACMP/ES CRM)
cluster.es.cspoc
cluster.es.hc (for HACMP/ES CRM)
cluster.es.taskguides
cluster.man.en_US.es
cluster.msg.En_US.cspoc
cluster.msg.En_US.es
cluster.msg.en_US.cspoc
cluster.msg.en_US.es
(有关es的全部) 安装最新的AIX和HACMP补丁
创建一个临时文件系统,将文件上载到机器上:
smitty update_all
(次命令将只升级当前系统中存在的软件包) SSA微码升级
使用以下命令可以看到一些设备的微码状态:
lscfg –vl | grep ssa0 看SSA卡微码(ROS要升到A400才可以)
lscfg –vp | grep –p ROM 看系统微码
将下载的微码解压到硬盘:
tar –xvf XXX
运行smitty installp安装相应文件包。
运行cfgmgr –v让系统重新识别,自动完成SSA Adapter升级。
使用diag命令履行硬盘微码升级。
设置主机名
smitty hostname à Line 1
同时修改/etc/hosts文件(在两台机器上分别改):
127.0.0.1 loopback localhost jmnx1 为所有网卡绑定boot或standby的IP地址
smitty mktcpip à 选网卡en1à 设置hostname和IP;Start Now = Yes
注意service地址不在此时设置。 NOTES:
1. 这里hostname不2. 是刚才设置的hostname。boot和standby网卡要对应不同3. hostname。以下是一个范例(典型的一组HA)。
IP hostname
3.1.1.1 jmnx1_svc
3.1.1.2 jmnx1_boot
1.1.2.1 jmnx1_stby 3.1.1.3 jmnx2_svc
3.1.1.4 jmnx2_boot
1.1.2.2 jmnx2_stby
4. 以上这些内容都要写入两台机器的/etc/hosts文件。
注意这个文件很容易被系统自动改动,安装配置HA时必须经常检查。
5. 检查/.rhosts,6. 这个文件应记录上述所有hostname。
7. 分辨网卡位置:
内置网卡标号enX最大;
外置网卡标号从机箱背后看由左到右依次增大。
8. 如果要修改IP设置,9. 可使用:
rmdev –dl enX 删掉网卡
smitty inet à Add a Network Interface
à Add a Standard Ethernet Interface
à 选entX,重新设置。Current State改为Up
10. 开机未启HA时,11. boot地址生效;
启动HA后,service地址生效;
service地址对应网卡失效后,由standby地址接管。
12. IP地址设置规则:
service和boot在同一网段;
standby必须与上面两者在不同网段; 创建VG、LV和FS
这些工作只需在一台机器上做,在另一台机器上必须先删去所有pdisk。
rmdev –dl hdiskX
注意先用lsdev –Cc disk看一下,不要把内置硬盘也删掉。
创建RAID。
注意要Enable Fast Read/Write
创建VG。
smitty mkvg à
Activate VG automatically at system restart: No
Create VG Concurrent Capable: Yes/No (是/否concurrent)
Auto-varyon in Concurrent Mode: No
smitty chvg à
QUORUM Yes/No
创建LV和FS(FS不要Auto Mount)。
在一台机器上varyonvg再varyoffvg所有共享或接管VG。
在另一台机器上importvg。
importvg –y VGName hdiskX (hdiskX为该VG中任何一个盘)
smitty chvg 修改VG为Not Auto-varyon
varyonvg VGName
varyoffvg VGName NOTE:
HA未启动时,一旦由一台机器改变了共享或接管VG的结构(LV、FS级),则另一台机器一定要exportvg该VG后再次importvg才能使用。
如果共享或接管VG不止一个,则:
smitty mkvg时要指定Major Number;
importvg时对同一VG要指定与上面相同的Major Number: importvg -V MajorNum ...
修改系统参数
Extend the size of file system "/var" to 200M.
Change characteristics of aio
smitty chgaio
MINIMUM number of servers [20]
MAXIMUM number of servers [40]
STATE to be configured at system restart available
State of fast path enable
Change characteristics of Operating System
smitty chgsys
Maximum number of PROCESSES allowed per user [512/1024]
HIGH water mark for pending write I/Os per file [33]
LOW water mark for pending write I/Os per file [24]
Change syncd frequency
smitty cm_tuning_parms
syncd frequency (in seconds) [10]
Change number of licensed users
smitty chlicense
Maximum number of FIXED licenses [512]
Enable Fast-Write for SSA
smitty ssadlog 重启两台机器
shutdown -Fr
配置HACMP
smitty hacmp
Add Cluster
Cluster ID: 1
Cluster Name: XXX
Add Node
Node Name: jmnx1 jmnx2
注意应该是第14点中对应的hostname。
Add Adapter (IP)
给所有在/etc/hosts中定义过的svc/boot/stby添加一个IP Adapter。
service adapter在boot/standby之后定义,不然会修改/etc/hosts。
IP Label: See /etc/hosts
N/W Type: ether
N/W Attribute: public
Adapter Function: service/standby/boot
Adapter Identifier: 即相应IP地址
即netstat –in显示中相应网卡的Address一栏,但最后两位必须不同。
如系统显示:0.6.29.6c.13.9a,可以填:0.6.29.6c.13.11
注意以上两项只需一个,且只有service adapter需用H/W Address。
Node Name: jmnx1或jmnx2等
注意rotating方式中定义service adapter时,此项应该空着,表示这个service IP label为两台机器共享。
Add Adapter (TTY)
e.g.:
tty_a; rs232(网络类型); rs232_net(自定网络名); serial; service; /dev/tty3; (空); jmnx1
Sync Topology
Add Resource Group
RG Name: XXX(应用服务名)
Node Relationship: cascading/concurrent/rotating
Participate Nodes: Jmnx1 Jmnx2
注意书写先后表示优先级,即初始该RG为哪个Node所有。
Add Application Server
Server Name: XXX
Start Script: /tmp/...(自定)
Stop Script: /tmp/...(自定)
Edit executable files: “startapp” & “stopapp” to certain directory and copy to the same position of the other machine.
注意script中的banner语句并不一定能在hacmp.out中有输出,为了验证其确实已被运行,可以在其中加上诸如date > file等的写文件语句。
Change Resource Attribute of a RG
IP Label 用service IP label,如apps_svc, pbxc_svc等,
FS: XXX 设置启动HA或接管时自动mount的file system。
VG: XXX 设置启动HA或接管时自动varyon的VG。
注意VG可选择相应的资源也可以空着,但两个RG不能使用同一个VG。
Sync RG NOTES:
HA启动后,除非共享或接管VG有disk一级的变动(增加/减少硬盘),一般不需要手动去同步两边VG。
当Topology有了修改之后,不但要Sync Topology,还要Sync RG。
双机单组HA中三种方式的比较:
TYPE SERVICE IP ADAPTER NUM. SERVICE IP LABEL
rotating 1 1
cascading 2 2 and 1 is required for each RG
concurrent 2 not required
故在定义concurrent RG时,不要填IP label。rotating中只有一个共享svc IP,就填这一个即可。
配置内容示例:
Configure HACMP for Rotating Resource Group
Define Cluster Topology
Define 1 cluster, 2 nodes, 2 boot adapter, 1 IP service adapter, 2 standby adapter, 2 serial service adapter.
Synchronize the cluster topology.
Define Resources
Define 1 rotating resource group with 2 participating nodes.
Define 1 application server and write corresponding start and stop scripts.
Configuring Resource for Resource Group
Add Service IP Label, Filesystems, Volume Groups, Application Servers into Resource Group.
Synchronize cluster resource.
Configure HACMP for Concurrent Resource Group
Define Cluster Topology
Define 1 cluster, 2 nodes, 2 boot adapter, 2 service IP adapter, 2 standby adapter, 2 serial service adapter.
Synchronize the cluster topology.
Define Resources
Define 1 concurrent resource group and 2 cascading resource group.
Define 2 application server and write corresponding start and stop scripts.
Configuring Resource for Resource Group
Add concurrent shared VGs to concurrent resource group.
Separately add 2 service IP adapter, 2 application server to 2 cascading resource group.
HA测试(一): 启动和关闭
在Concurrent中确保VG在两边都被varyoff
smitty clstart 启动HA
tail –f /tmp/hacmp.out 看启动输出信息
tail –f /tmp/cm.log 看错误信息
netstat –i 和 –in 看IP地址是否变为service地址
lsvg –o Concurrent中看VG是否在两台机器上被varyon
lssrc –g cluster 看相应SRC是否起来(应该显示2或3个SRC)
smitty clstop 关闭HA
à graceful(正常)/takeover(接管)/force(强制,IP不变回boot)
这里就选graceful
tail –f /tmp/hacmp.out 看关闭输出信息
tail –f /tmp/cm.log 看错误信息
netstat –i 和 –in 看IP地址是否变为boot地址
lssrc –g cluster 看相应SRC是否已关闭(应该无SRC显示)
使用Cluster Snapshot可以保存当前Cluster配置,以后直接Apply就可恢复。 HA测试(二):本机IP接管
确定两台机器HA已正常启动。
拔去与主机service IP关联的网卡的网线。
在主机上运行:
netstat –i 和 –in
这时standby网卡将接管service IP而原service网卡将对应standby IP。
备机不发生任何反应。
插回主机上拔去的网线并运行:
netstat –i 和 –in
这时主机没有任何复原动作,原standby网卡仍对应service IP而原service网
卡仍对应standby IP,即便关闭HA也不会变回来。 en0 en1
启动HA前对应IP boot stdby
启动HA后对应IP svc stdby
拔去en0网线后对应IP stdby svc
关闭HA后对应IP stdby boot 要使网卡恢复最初的对应IP,可以运行:
smitty mktcpip
选定网卡(en0, en1, ... ),不作任何改动回车。 HA测试(三):资源接管
确定两台机器HA已正常启动。
模拟主机异常终止运行:
方法一:主机上运行:
smitty clstopà 关闭方式选takeover
这种测试是主动告诉对方需要接管,并不是真正模拟了故障,可以
在进行真正故障模拟之前先进行这一步测试。
方法二:主机上运行halt –q即时关机(最佳方法)。
方法三:同时拔去主机所有网线和心跳线。
方法四:主机拔电(不建议)。
在备机上运行:
netstat –i 和 –in
如果备机也有service网卡(在cascading,即mutual takeover配置下),这时备机
的standby网卡将接管主机的service IP;
如果备机没有service网卡(在rotating,即standby配置下),这时备机的boot网
卡将接管主机的service IP。 当备机有svc地址:
备机en0 备机en1
启动HA前对应IP 备机boot 备机stdby
启动HA后对应IP 备机svc 备机stdby
发生接管后对应IP 备机svc 主机svc 当备机无svc地址:
备机en0 备机en1
启动HA前对应IP 备机boot 备机stdby
启动HA后对应IP 备机boot 备机stdby
发生接管后对应IP 主机svc 备机stdby 在备机上运行:
lsvg –o
在resource group中定义的VG应该在备机上自动varyon。
在备机上运行:
mount
在resource group中定义的FS应该在备机上自动mount。 NOTES:
运行smitty clstop后有3种停止方式可供选择:
graceful 本机正常退出HA环境,恢复boot地址。不发生接管。
takeover 本机正常退出HA环境,恢复boot地址。发生接管,备机获得主机svc IP。
force 本机强制退出HA环境,不恢复boot地址。不发生接管。
当用graceful方式无法完全退出HA环境时(即lssrc –g cluster仍能看到显示,并
且svc IP没有变回boot IP),可以用force退出。
force退出以后lssrc –g cluster不会看到显示,但svc IP也不会变回boot IP,必须
手工运行一次smitty mktcpip(不改任何选项)。
如果将一台机器的两根网线都拔掉,则备机并不会接管该机器的svc IP。
因为备机仍可以通过心跳线监测到主机存活。而对于网络来说,HA只防备单点故障,如果主机上两个网络都断了,它没有响应的能力。
如果要模拟接管,则必须将心跳线也拔掉。
模拟硬盘更换
预做方案
630机器,内置4个18G硬盘,2个做RAID,存储数据,一块做系统,另一块做热备。因数据量增大,要扩充硬盘容量,将18G数据存储盘换成36G。 查看硬盘信息
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
#
注:此为另一机器,举例。
记下要更换硬盘的SERIAL
把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
rmdev -l hdiskX –d在系统中把硬盘删掉
关机
shutdown –F
若有服务,如ORACLE,SYBAE等,先停服务。
准备工作
将防静电手链带上,另一端连金属物
拆机箱
把机器的外壳挡板拆下
更换硬盘
找到相应SERIAL的硬盘,在硬盘架上能看到,拨下。
将新硬盘换上
开机
查看硬盘
lspv
这时能看到新硬盘的SERIAL,hdiskX, 此处X可能为其它数字,因为系统可能将新硬盘认做其它PV,也可能是以前的PV
改PV
将hdiskX 改为以前ID,此处不会!也可能不用改。
做镜像
extendvg datavg hdiskX把diskX添加到datavg中, 大约需要10多秒
mirrorvg datavg 做镜像,可能会比较长的时间
把另一块盘18G拿掉
unmirrorvg hdiskX datavg
reducevg hdiskX datavg
rmdev –dl hdiskX
关机
更换硬盘
开机
查看硬盘信息
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
#
注:此为另一机器,举例。
记下要更换硬盘的SERIAL
改PV
将hdiskX 改为以前ID,此处不会!也可能不用改
做镜像
extendvg datavg hdiskX把diskX添加到datavg中, 大约需要10多秒
mirrorvg datavg 做镜像,可能会比较长的时间
起服务
oracle或SYBASE 英迈强人
网上文章 我从来都不写这些的。照顾你吧:
把把机器的前面板拆下
查看硬盘信息
# lspv 看哪个盘是干什么用的。
# lsdev -Ccdik,通过SCSI ID确定盘位(硬盘笼上标有)
把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
去掉HOTSPARE盘。
rmdev -dl hdiskX 在系统中把要卸掉的硬盘都删掉。
然后把卸掉的两块硬盘抽出,不需要关机,也不用什么防静电带,只要你别乱摸就行,它本来就是热插拔的。然后把两块36G硬盘插入空出来的硬盘槽。
运行
cfgmgr
chvg -t 2 datavg
chvg -t 2 rootvg
lspv查看硬盘情况。
extendvg
6。migratepy hdiskX hdiskY,很安全的,尽管放心。
7。reducevg
8。rmdev -dl hdiskX
9。把18G硬盘拔掉,插入36G盘。
10。cfgmgr
11。lspv
12。extendvg,
13。mirrorvg
14。HOTSPARE(其实不如mirrorvg roootvg)
15。检查,OK。 第二方案
把把机器的前面板拆下 查看硬盘信息,看哪个盘是干什么用的
lspv
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
此处应该有HDISK2,HDISK3为DATAVG, 把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
rmdev -dl hdiskX 在系统中把要卸掉的硬盘都删掉
然后把卸掉的两块硬盘抽出一块,不需要关机,也不用什么防静电带,只要你别乱摸就行,它本来就是热插拔的。然后把两一块36G硬盘插入空出来的硬盘槽。
把硬盘做成PV
运行
cfgmgr lspv查看硬盘情况
看新添加的硬盘被认作是哪个PV,即hdiskA-----36G第一块
把硬盘加到VG中
extendvg hdiskA datavg
更改VG中的PP NUMBER
chvg -t 2 datavg
chvg -t 2 rootvg
把18G硬盘数据复制到36G上,
migratepy hdiskB(----为数据盘中未换下的18G硬盘) hdiskA,很安全的,尽管放心。
取下另一18G硬盘
reducevg hdiskC datavg
rmdev -dl hdiskC
把18G硬盘拔掉,插入36G盘
把硬盘做成PV
运行
cfgmgr lspv查看硬盘情况
看新添加的硬盘被认作是哪个PV,即hdiskD
把硬盘加到VG中
extendvg hdiskD datavg
做镜像
mirrorvg datavg hdiskA hdiskD
hdiskA为先换上的36G硬盘,hdiskD为后换上的36G硬盘
检查,OK
HDISK0和HDISK1做成MIRROR,是ROOTVG
#mirrorvg rootvg hdisk0 hdisk1
先做系统备份
tctl –f /dev/rmt0 rewind
smitty mksysb
查看HDISK0的S/N,P/N号等,在换盘的时候做对照
lscfg –vl hdisk0
#lscfg -vl hdisk0
DEVICE LOCATION DESCRIPTION
hdisk0 11-08-00-2,0 16 Bit LVD SCSI Disk Drive (36400
MB)
Manufacturer................IBM
Machine Type and Model......IC35L036UCDY10-0
FRU Number..................00P3831
ROS Level and ID............53323154
Serial Number...............E3V59K0B
EC Level....................H32224
Part Number.................08K0293
Device Specific.(Z0)........000003029F00013A
Device Specific.(Z1)........07N4972
Device Specific.(Z2)........0068
Device Specific.(Z3)........02305
Device Specific.(Z4)........0001
Device Specific.(Z5)........22
Device Specific.(Z6)........**********
查看物理卷
lspv 查看逻辑卷组
lsvg
查看在用的逻辑卷组
lsvg –o
# lsvg -o
orclvg
rootvg
# 查看所有硬盘(包括逻辑盘)的状态
# lsdev -Cc disk
hdisk0 Available 11-08-00-2,0 16 Bit LVD SCSI Disk Drive
hdisk1 Available 11-08-00-4,0 16 Bit LVD SCSI Disk Drive
#
查看7133磁盘柜硬盘状态
lsdev –Cc pdisk
停HACMP
smitty clstop
使用lsvg –o 命令会看不到一些(应用)VG(1号机会接管);使用 netstat –ir命令可以看到系统SVC地址会变成BOOT地址 把HDISK0从ROOTVG中不做MIRROW
unmirrorvg rootvg hdisk0
查看物理卷
lspv
这时HDISK0不在和HDISK1为MIRROR
把hdisk0从rootvg中去除
reducevg rootvg hdisk0
在HDISK1上创建boot image
bosboot –ad hdisk1
改变启动设备的顺序
bootlist –m normal hdisk1 cd0
删除HDISK0
rmdev –l disk0 –d
lspv
lscfg –vl hdisk0
以上2条命令不会显示HDISK0的相关信息
关机
shutdown –F
把2号机的外设机箱取出,更换硬盘。注意要标好各电缆的位置
开机 lspv
发现多出HDISK4,而我们需要的是HDISK0
删除HDISK4
rmdev –l hdisk4 –d
cfgmgr
lspv
发现多出HDISK0,HDISK4,可能是我前面删除HDISK0,没有做cfgmgr的原因
删除HDISK4,HDISK0
rmdev –l hdisk4 –d
rmdev –l hdisk0 –d
cfgmgr
lspv
好了,HDISK0出现了
把HDISK0加到ROOTVG中并做镜像
extendvg rootvg hdisk0
做MIRROR
mirrorvg –c 2 rootvg
查看PV
lspv
OK
在HDISK0,HDISK1上创建boot image
bosboot –ad hdisk0
bosboot –ad hdisk1
改变启动设备的顺序
bootlist –m normal hdisk0,hdisk1 cd0
重启动2号机
shutdown –Fr
关闭1号机的HACMP
Smitty clstop
重启动1号机
shutdown –Fr
启动1号机的HACMP
smitty clstart
启动2号机的HACMP
smitty clstart
一切OK
注意
可观察CLUSTER的启动:/usr/es/adm/cluster.log, /tmp/hacmp.out
CLUSTER的版本 lslpp –l|grep cluster
网络的状态 netstat -ni
第六章 HACMP安装配置
准备工作
HACMP相应安装CD。
AIX安装CD。
RM0X补丁CD或最新download的补丁。
SSA Adapter和Disk的微码。
www.hursley.ibm.com/ssa/rs6k/
IP地址。
VG、LV、FS用于HA的配置计划。
了解跑什么应用,Start/Stop Script应该怎么写。 . 确认7133阵列、8port卡和心跳线已连好,机器启动完毕 . 检查每台机器上是否都找到了所有硬盘
lspv
lsdev –Cc disk
如果某台机器没有找到共享硬盘,可用cfgmgr命令。
cfgmgr . 给系统添加TTY
如果安装了8port卡,一共应该有sa0 ~ sa4共5个tty,依次(0 ~ 4)安装。
smitty tty à Add a TTY à rs232 à saX à Port Number: 0 NOTES:
如果使用串行口连心跳线,只能用sa3(即串口4)。
串口4一般位于4个串口的右下一个。
检测连8port卡的TTY
在两台机器上同时运行:
stty < /dev/tty0
这时应该有信息显示。 . 安装Bundle: App_Dev; Client, Server
smitty easy_install
使用AIX安装CD安装文件
smitty installp à Line 1
选择: bos.dosutility
bos.data
X11.vsm* (只在装HA时选择了vsm包时需要) . 安装Base Document
smitty installp à Line 1
选择: bos*; perfagent* 安装系统补丁
使用AIX UPDATE CD
选择: bos.adt* 修改.profile和.dtprofile文件
修改: .dtprofile: DTSOURCEPROFILE=true
.profile: export PS1=’[’`hostname`’:$PWD]’ 修改电源管理
lscfg –vpl pmc0
应该有显示。
smitty pm à Line 2 à Line 2 (Unconfig)
Netscape安装和配置
确认Netscape已安装。
确认docsearch可以运行。
这是基于Netscape的AIX帮助系统。
建立/.netscape文件系统,大小约为10M。 安装HACMP/ES软件
放入HACMP/ES光盘:
smitty installp à Line 1
选择: cluster.adt.es
cluster.doc.en_US
cluster.doc.en_US.es
cluster.es
cluster.es.clvm (for HACMP/ES CRM)
cluster.es.cspoc
cluster.es.hc (for HACMP/ES CRM)
cluster.es.taskguides
cluster.man.en_US.es
cluster.msg.En_US.cspoc
cluster.msg.En_US.es
cluster.msg.en_US.cspoc
cluster.msg.en_US.es
(有关es的全部) 安装最新的AIX和HACMP补丁
创建一个临时文件系统,将文件上载到机器上:
smitty update_all
(次命令将只升级当前系统中存在的软件包) SSA微码升级
使用以下命令可以看到一些设备的微码状态:
lscfg –vl | grep ssa0 看SSA卡微码(ROS要升到A400才可以)
lscfg –vp | grep –p ROM 看系统微码
将下载的微码解压到硬盘:
tar –xvf XXX
运行smitty installp安装相应文件包。
运行cfgmgr –v让系统重新识别,自动完成SSA Adapter升级。
使用diag命令履行硬盘微码升级。
设置主机名
smitty hostname à Line 1
同时修改/etc/hosts文件(在两台机器上分别改):
127.0.0.1 loopback localhost jmnx1 为所有网卡绑定boot或standby的IP地址
smitty mktcpip à 选网卡en1à 设置hostname和IP;Start Now = Yes
注意service地址不在此时设置。 NOTES:
1. 这里hostname不2. 是刚才设置的hostname。boot和standby网卡要对应不同3. hostname。以下是一个范例(典型的一组HA)。
IP hostname
3.1.1.1 jmnx1_svc
3.1.1.2 jmnx1_boot
1.1.2.1 jmnx1_stby 3.1.1.3 jmnx2_svc
3.1.1.4 jmnx2_boot
1.1.2.2 jmnx2_stby
4. 以上这些内容都要写入两台机器的/etc/hosts文件。
注意这个文件很容易被系统自动改动,安装配置HA时必须经常检查。
5. 检查/.rhosts,6. 这个文件应记录上述所有hostname。
7. 分辨网卡位置:
内置网卡标号enX最大;
外置网卡标号从机箱背后看由左到右依次增大。
8. 如果要修改IP设置,9. 可使用:
rmdev –dl enX 删掉网卡
smitty inet à Add a Network Interface
à Add a Standard Ethernet Interface
à 选entX,重新设置。Current State改为Up
10. 开机未启HA时,11. boot地址生效;
启动HA后,service地址生效;
service地址对应网卡失效后,由standby地址接管。
12. IP地址设置规则:
service和boot在同一网段;
standby必须与上面两者在不同网段; 创建VG、LV和FS
这些工作只需在一台机器上做,在另一台机器上必须先删去所有pdisk。
rmdev –dl hdiskX
注意先用lsdev –Cc disk看一下,不要把内置硬盘也删掉。
创建RAID。
注意要Enable Fast Read/Write
创建VG。
smitty mkvg à
Activate VG automatically at system restart: No
Create VG Concurrent Capable: Yes/No (是/否concurrent)
Auto-varyon in Concurrent Mode: No
smitty chvg à
QUORUM Yes/No
创建LV和FS(FS不要Auto Mount)。
在一台机器上varyonvg再varyoffvg所有共享或接管VG。
在另一台机器上importvg。
importvg –y VGName hdiskX (hdiskX为该VG中任何一个盘)
smitty chvg 修改VG为Not Auto-varyon
varyonvg VGName
varyoffvg VGName NOTE:
HA未启动时,一旦由一台机器改变了共享或接管VG的结构(LV、FS级),则另一台机器一定要exportvg该VG后再次importvg才能使用。
如果共享或接管VG不止一个,则:
smitty mkvg时要指定Major Number;
importvg时对同一VG要指定与上面相同的Major Number: importvg -V MajorNum ...
修改系统参数
Extend the size of file system "/var" to 200M.
Change characteristics of aio
smitty chgaio
MINIMUM number of servers [20]
MAXIMUM number of servers [40]
STATE to be configured at system restart available
State of fast path enable
Change characteristics of Operating System
smitty chgsys
Maximum number of PROCESSES allowed per user [512/1024]
HIGH water mark for pending write I/Os per file [33]
LOW water mark for pending write I/Os per file [24]
Change syncd frequency
smitty cm_tuning_parms
syncd frequency (in seconds) [10]
Change number of licensed users
smitty chlicense
Maximum number of FIXED licenses [512]
Enable Fast-Write for SSA
smitty ssadlog 重启两台机器
shutdown -Fr
配置HACMP
smitty hacmp
Add Cluster
Cluster ID: 1
Cluster Name: XXX
Add Node
Node Name: jmnx1 jmnx2
注意应该是第14点中对应的hostname。
Add Adapter (IP)
给所有在/etc/hosts中定义过的svc/boot/stby添加一个IP Adapter。
service adapter在boot/standby之后定义,不然会修改/etc/hosts。
IP Label: See /etc/hosts
N/W Type: ether
N/W Attribute: public
Adapter Function: service/standby/boot
Adapter Identifier: 即相应IP地址
即netstat –in显示中相应网卡的Address一栏,但最后两位必须不同。
如系统显示:0.6.29.6c.13.9a,可以填:0.6.29.6c.13.11
注意以上两项只需一个,且只有service adapter需用H/W Address。
Node Name: jmnx1或jmnx2等
注意rotating方式中定义service adapter时,此项应该空着,表示这个service IP label为两台机器共享。
Add Adapter (TTY)
e.g.:
tty_a; rs232(网络类型); rs232_net(自定网络名); serial; service; /dev/tty3; (空); jmnx1
Sync Topology
Add Resource Group
RG Name: XXX(应用服务名)
Node Relationship: cascading/concurrent/rotating
Participate Nodes: Jmnx1 Jmnx2
注意书写先后表示优先级,即初始该RG为哪个Node所有。
Add Application Server
Server Name: XXX
Start Script: /tmp/...(自定)
Stop Script: /tmp/...(自定)
Edit executable files: “startapp” & “stopapp” to certain directory and copy to the same position of the other machine.
注意script中的banner语句并不一定能在hacmp.out中有输出,为了验证其确实已被运行,可以在其中加上诸如date > file等的写文件语句。
Change Resource Attribute of a RG
IP Label 用service IP label,如apps_svc, pbxc_svc等,
FS: XXX 设置启动HA或接管时自动mount的file system。
VG: XXX 设置启动HA或接管时自动varyon的VG。
注意VG可选择相应的资源也可以空着,但两个RG不能使用同一个VG。
Sync RG NOTES:
HA启动后,除非共享或接管VG有disk一级的变动(增加/减少硬盘),一般不需要手动去同步两边VG。
当Topology有了修改之后,不但要Sync Topology,还要Sync RG。
双机单组HA中三种方式的比较:
TYPE SERVICE IP ADAPTER NUM. SERVICE IP LABEL
rotating 1 1
cascading 2 2 and 1 is required for each RG
concurrent 2 not required
故在定义concurrent RG时,不要填IP label。rotating中只有一个共享svc IP,就填这一个即可。
配置内容示例:
Configure HACMP for Rotating Resource Group
Define Cluster Topology
Define 1 cluster, 2 nodes, 2 boot adapter, 1 IP service adapter, 2 standby adapter, 2 serial service adapter.
Synchronize the cluster topology.
Define Resources
Define 1 rotating resource group with 2 participating nodes.
Define 1 application server and write corresponding start and stop scripts.
Configuring Resource for Resource Group
Add Service IP Label, Filesystems, Volume Groups, Application Servers into Resource Group.
Synchronize cluster resource.
Configure HACMP for Concurrent Resource Group
Define Cluster Topology
Define 1 cluster, 2 nodes, 2 boot adapter, 2 service IP adapter, 2 standby adapter, 2 serial service adapter.
Synchronize the cluster topology.
Define Resources
Define 1 concurrent resource group and 2 cascading resource group.
Define 2 application server and write corresponding start and stop scripts.
Configuring Resource for Resource Group
Add concurrent shared VGs to concurrent resource group.
Separately add 2 service IP adapter, 2 application server to 2 cascading resource group.
HA测试(一): 启动和关闭
在Concurrent中确保VG在两边都被varyoff
smitty clstart 启动HA
tail –f /tmp/hacmp.out 看启动输出信息
tail –f /tmp/cm.log 看错误信息
netstat –i 和 –in 看IP地址是否变为service地址
lsvg –o Concurrent中看VG是否在两台机器上被varyon
lssrc –g cluster 看相应SRC是否起来(应该显示2或3个SRC)
smitty clstop 关闭HA
à graceful(正常)/takeover(接管)/force(强制,IP不变回boot)
这里就选graceful
tail –f /tmp/hacmp.out 看关闭输出信息
tail –f /tmp/cm.log 看错误信息
netstat –i 和 –in 看IP地址是否变为boot地址
lssrc –g cluster 看相应SRC是否已关闭(应该无SRC显示)
使用Cluster Snapshot可以保存当前Cluster配置,以后直接Apply就可恢复。 HA测试(二):本机IP接管
确定两台机器HA已正常启动。
拔去与主机service IP关联的网卡的网线。
在主机上运行:
netstat –i 和 –in
这时standby网卡将接管service IP而原service网卡将对应standby IP。
备机不发生任何反应。
插回主机上拔去的网线并运行:
netstat –i 和 –in
这时主机没有任何复原动作,原standby网卡仍对应service IP而原service网
卡仍对应standby IP,即便关闭HA也不会变回来。 en0 en1
启动HA前对应IP boot stdby
启动HA后对应IP svc stdby
拔去en0网线后对应IP stdby svc
关闭HA后对应IP stdby boot 要使网卡恢复最初的对应IP,可以运行:
smitty mktcpip
选定网卡(en0, en1, ... ),不作任何改动回车。 HA测试(三):资源接管
确定两台机器HA已正常启动。
模拟主机异常终止运行:
方法一:主机上运行:
smitty clstopà 关闭方式选takeover
这种测试是主动告诉对方需要接管,并不是真正模拟了故障,可以
在进行真正故障模拟之前先进行这一步测试。
方法二:主机上运行halt –q即时关机(最佳方法)。
方法三:同时拔去主机所有网线和心跳线。
方法四:主机拔电(不建议)。
在备机上运行:
netstat –i 和 –in
如果备机也有service网卡(在cascading,即mutual takeover配置下),这时备机
的standby网卡将接管主机的service IP;
如果备机没有service网卡(在rotating,即standby配置下),这时备机的boot网
卡将接管主机的service IP。 当备机有svc地址:
备机en0 备机en1
启动HA前对应IP 备机boot 备机stdby
启动HA后对应IP 备机svc 备机stdby
发生接管后对应IP 备机svc 主机svc 当备机无svc地址:
备机en0 备机en1
启动HA前对应IP 备机boot 备机stdby
启动HA后对应IP 备机boot 备机stdby
发生接管后对应IP 主机svc 备机stdby 在备机上运行:
lsvg –o
在resource group中定义的VG应该在备机上自动varyon。
在备机上运行:
mount
在resource group中定义的FS应该在备机上自动mount。 NOTES:
运行smitty clstop后有3种停止方式可供选择:
graceful 本机正常退出HA环境,恢复boot地址。不发生接管。
takeover 本机正常退出HA环境,恢复boot地址。发生接管,备机获得主机svc IP。
force 本机强制退出HA环境,不恢复boot地址。不发生接管。
当用graceful方式无法完全退出HA环境时(即lssrc –g cluster仍能看到显示,并
且svc IP没有变回boot IP),可以用force退出。
force退出以后lssrc –g cluster不会看到显示,但svc IP也不会变回boot IP,必须
手工运行一次smitty mktcpip(不改任何选项)。
如果将一台机器的两根网线都拔掉,则备机并不会接管该机器的svc IP。
因为备机仍可以通过心跳线监测到主机存活。而对于网络来说,HA只防备单点故障,如果主机上两个网络都断了,它没有响应的能力。
如果要模拟接管,则必须将心跳线也拔掉。
模拟硬盘更换
预做方案
630机器,内置4个18G硬盘,2个做RAID,存储数据,一块做系统,另一块做热备。因数据量增大,要扩充硬盘容量,将18G数据存储盘换成36G。 查看硬盘信息
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
#
注:此为另一机器,举例。
记下要更换硬盘的SERIAL
把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
rmdev -l hdiskX –d在系统中把硬盘删掉
关机
shutdown –F
若有服务,如ORACLE,SYBAE等,先停服务。
准备工作
将防静电手链带上,另一端连金属物
拆机箱
把机器的外壳挡板拆下
更换硬盘
找到相应SERIAL的硬盘,在硬盘架上能看到,拨下。
将新硬盘换上
开机
查看硬盘
lspv
这时能看到新硬盘的SERIAL,hdiskX, 此处X可能为其它数字,因为系统可能将新硬盘认做其它PV,也可能是以前的PV
改PV
将hdiskX 改为以前ID,此处不会!也可能不用改。
做镜像
extendvg datavg hdiskX把diskX添加到datavg中, 大约需要10多秒
mirrorvg datavg 做镜像,可能会比较长的时间
把另一块盘18G拿掉
unmirrorvg hdiskX datavg
reducevg hdiskX datavg
rmdev –dl hdiskX
关机
更换硬盘
开机
查看硬盘信息
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
#
注:此为另一机器,举例。
记下要更换硬盘的SERIAL
改PV
将hdiskX 改为以前ID,此处不会!也可能不用改
做镜像
extendvg datavg hdiskX把diskX添加到datavg中, 大约需要10多秒
mirrorvg datavg 做镜像,可能会比较长的时间
起服务
oracle或SYBASE 英迈强人
网上文章 我从来都不写这些的。照顾你吧:
把把机器的前面板拆下
查看硬盘信息
# lspv 看哪个盘是干什么用的。
# lsdev -Ccdik,通过SCSI ID确定盘位(硬盘笼上标有)
把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
去掉HOTSPARE盘。
rmdev -dl hdiskX 在系统中把要卸掉的硬盘都删掉。
然后把卸掉的两块硬盘抽出,不需要关机,也不用什么防静电带,只要你别乱摸就行,它本来就是热插拔的。然后把两块36G硬盘插入空出来的硬盘槽。
运行
cfgmgr
chvg -t 2 datavg
chvg -t 2 rootvg
lspv查看硬盘情况。
extendvg
6。migratepy hdiskX hdiskY,很安全的,尽管放心。
7。reducevg
8。rmdev -dl hdiskX
9。把18G硬盘拔掉,插入36G盘。
10。cfgmgr
11。lspv
12。extendvg,
13。mirrorvg
14。HOTSPARE(其实不如mirrorvg roootvg)
15。检查,OK。 第二方案
把把机器的前面板拆下 查看硬盘信息,看哪个盘是干什么用的
lspv
# lspv
hdisk0 000cd60d520a23a9 rootvg
hdisk1 000cd60d8a7b8d98 orclvg
此处应该有HDISK2,HDISK3为DATAVG, 把要更换硬盘从VG中拿掉
unmirrorvg datavg hdiskX去掉镜像
reducevg hdiskX datavg把要更换的硬盘从VG中拿掉
rmdev -dl hdiskX 在系统中把要卸掉的硬盘都删掉
然后把卸掉的两块硬盘抽出一块,不需要关机,也不用什么防静电带,只要你别乱摸就行,它本来就是热插拔的。然后把两一块36G硬盘插入空出来的硬盘槽。
把硬盘做成PV
运行
cfgmgr lspv查看硬盘情况
看新添加的硬盘被认作是哪个PV,即hdiskA-----36G第一块
把硬盘加到VG中
extendvg hdiskA datavg
更改VG中的PP NUMBER
chvg -t 2 datavg
chvg -t 2 rootvg
把18G硬盘数据复制到36G上,
migratepy hdiskB(----为数据盘中未换下的18G硬盘) hdiskA,很安全的,尽管放心。
取下另一18G硬盘
reducevg hdiskC datavg
rmdev -dl hdiskC
把18G硬盘拔掉,插入36G盘
把硬盘做成PV
运行
cfgmgr lspv查看硬盘情况
看新添加的硬盘被认作是哪个PV,即hdiskD
把硬盘加到VG中
extendvg hdiskD datavg
做镜像
mirrorvg datavg hdiskA hdiskD
hdiskA为先换上的36G硬盘,hdiskD为后换上的36G硬盘
检查,OK
相关阅读 更多 +