CASE 1:High Performance Computing集群中共享盘..
时间:2007-06-18 来源:devotion
集群体系结构:
32节点 HP DL360 380(IO节点外接盘阵为U1,U2,U3)
主机名为hp-00,hp-01...hp-29 其中29为管理节点(所有机群需要并行运算软件的帐号都创建在此,然
后MOUNT到所有节点)
网络方面每节点3套网络内网:以210.XX.XX.XX开始 外网以10.XX.XX.XX开始 ILO卡略
症状:节点使用一段时间后DMESG里会记录nfs: server hp-io0 not responding, still trying,类似
此类问题。其他并无任何报错,目前已经更换了网卡程序,并试运行中依然没有效果,下一步打算手工限制网卡
传输速率~
下午上班的时候偶然一次查看内核报错的时候发现有这样的信息:mtrr: type mismatch for fc000000,800000 old: uncachable new: write-combining
经过查找发现如下资料: MTRR是Memory Type Range Register的缩写,可翻译为存储区域类型寄存器,它规定了读写某段范围物理内存的策略,用于优化CPU数据传送性能。例如可将MTTR设为在显存的地址范围上使用“write-combining”策略,CPU能够在PCI/AGP总线上,将许多次少量的数据写入集合成一次大的数据写入,这样能获得2.5倍以上图像传送速度的提升。Documentation/mtrr.txt对MTRR的使用有详细说明。 跟随这个MTRR的报错后面紧接着就是 nfs: server hp-io0 not responding, still trying
经过查找发现如下资料: MTRR是Memory Type Range Register的缩写,可翻译为存储区域类型寄存器,它规定了读写某段范围物理内存的策略,用于优化CPU数据传送性能。例如可将MTTR设为在显存的地址范围上使用“write-combining”策略,CPU能够在PCI/AGP总线上,将许多次少量的数据写入集合成一次大的数据写入,这样能获得2.5倍以上图像传送速度的提升。Documentation/mtrr.txt对MTRR的使用有详细说明。 跟随这个MTRR的报错后面紧接着就是 nfs: server hp-io0 not responding, still trying
不知道2者之间是否存在着某些问题,进一步查证中。
解决此问题的BLOG继续更新中~请高手路过留下您的意见~ 相关阅读 更多 +