09系统架构师大会:运维监控从这里开始
时间:2009-09-01 来源:linux论坛
首先出场的是北京武神世纪网络技术有限公司系统运维经理曹世军先生,他带来的是目前非常引人注目的网络游戏基础系统架构解析。
曹世军:网络游戏基础系统架构解析
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/K6igyVANSEs1lmhLRG7DWkoMcOYuCwfp.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
北京武神世纪网络技术有限公司系统运维经理曹世军
曹先生从网络游戏的运维需求开始讲起,他表示,要真正运营好一款网络游戏需要解决:苛刻的数据安全及系统安全要求;超乎寻常的网络延时敏感性及南北互联问题;故障硬件的快速替换及远程控制的可靠性;快速部署能力以满足游戏产品的爆发性增长导致的资源需求;快速且简单的实现大批量服务器的程序版本升级,以减少例行维护导致的服务不可用;快速且简单的合并、分散压力以应对频繁的合服、劈服操作;自动化运维实现的方便性。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/Tidu3J7kSf0Dq5UXG1bMEQsp62vetjVP.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
作为实战经验丰富的曹世军而言,解决这些需求并不是难事,关键在于“为了实现运维的需求,就需要把需求分拆,用单独的需求完善底层结构。其中帐号数据中心、游戏服务器组、游戏辅助服务器组、官方网站及论坛、游戏服务器操作系统就是重中之重。”在演讲的最后,曹世军以从业多年的经验给广大系统架构师一个提醒“设计架构要遵从先易后难的原则,在实践中不断完善架构体系,最终可以用自动化的手段管理整体网络。”
郑爽:WEB应用访问安全案例剖析
随后梭子鱼网络有限公司华北区销售总监郑爽针对“谈架构必然要谈及整体架构的安全策略实施,如何才能确保网络运维在一个安全高效的环境”这个话题开始了演讲。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/Zce3TYlC95iuSdrA46a7pvXjRmMyQbBV.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
梭子鱼网络有限公司华北区销售总监郑爽
“众所周知,Web应用已经成为大家所关注的重点。很多企业已经把传统业务流程放到网上进行应用,这不光是节省成本的考虑,更多是为了业务流程的透明和时效性。但是,随之而来的确是网络风险的加剧,企业网络被攻击案例时有发生,这背后既有企业不注重防范网络管理的因素在内,也有攻击者被背后的利益所驱动。”
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/kg3GVlyazJ4KE9tLi27USeqBMOHvhYoD.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
面对近年来日益凸显的Web攻击威胁,郑爽解释道:“如果应用Web攻击防护,非法访问、WEB站点伪装、WEB站点篡改、Outbound 数据窃取防护、应用传输加速、缓存 、压缩、TCP连接复用、SSL卸载和加速、负载均衡等等一系列的攻击都可以被抵御。同时,在审计及合规方面,Web攻击防护更可以帮助企业通过安全审计,达到PCI (支付卡) 应用安全规范要求,美国萨班法案(Sarbanes Oxley)及其他合规性要求。从商业角度衡量,都是有百利而无一害的事情。”
王怀志:有效监控系统,发现瓶颈关键点
网络监控一直是IT运维中的一大难点,这不仅是因为监控话题比较敏感,更是因为其技术和架构一向是不被人所熟悉,那么用什么办法可以有效监控网络了?海纳互联网研究中心主任技术总监王怀志先生在2009系统架构师大会上带来了精彩的演讲。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/JknFT9X6lB7ARsKL4bGUH1orIuDjcwQO.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
海纳互联网研究中心主任技术总监王怀志
传统的运维监控并不能很好的了解到系统运行的状态,就比如分析网络流量,通常得出结论:系统负载太高或者干脆得不出结论。分析Cpu和内存,就有可能告诉研发人员有问题,但不能告诉到底是什么问题。分析图表和数据,虽然有效,但是依赖与研发人员的技术经验和工作态度,从另一方面来说也是加大了分析风险。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/VKmd5cyvNW1ntSQfjrT3O9FwGpY0MeE8.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
相对来讲,运维监控需要改良和提高意识和手段,采取瓶颈监控的办法是对运维监控的有益补充,其为专门为了系统优化和瓶颈定位的监控。瓶颈监控优势在于相对准确的定位问题,缩短优化周期,降低研发风险,提高工作效率。其特点是深入系统内部进行监控统计,根据已知的问题来判断。而瓶颈监控的思想就是不断的分析与研究,在积累经验的基础上提高对系统重点的分析能力。
在谈到瓶颈监控对整体系统的益处,王怀志强调瓶颈监控是对运维监控的补充和有目的的细化;是依赖自己公司的历史经验和特定系统的设计原则;瓶颈监控降低了研发风险,提供科学的决策数据;建立公司自己的瓶颈监控系统,有助于研发经验的积累。
田逸:高考中国网负载均衡的设计
运维监控专场最后一个出场的是资深系统架构师田逸,刚一上场,田逸就自报家门“我今天主要来与大家分享我所做的一个实际案例:高考中国网高可用、可扩展、负载均衡的设计与实现技术。”如此快速切入主题的演讲,也是本次系统架构师的众多亮点之一。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/x9TVMQSWfn3CsvDEcXwuy4ezA2Rrpq1m.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
资深系统架构师田逸
像高考中国这种服务类网站在网络上有不少,但有很多网站却是因为架构设计不合理而频繁崩溃。就比如www.12388.gov.cn 刚发布就不堪负重,被“举报”而死;某在线报名系统因为报名人多,挂了;某旅游网站申领北京免费旅游门票被网民刷死。
基于以上特点,田逸总结,“建立高考中国网就必须要考虑在局部和整体都实现高可用、可扩展和负载均衡。”
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://images.lampchina.net/news/10/Gy9klcX7FaUdSs3iBx2MHu4YDZroCWnP.jpg');}" onmousewheel="return imgzoom(this);" alt="" />
那么如何实现这个目标了?“系统总体架构是重点,而重中之重则为负载均衡层、应用层、数据库层及共享文件系统。” 田逸对于中国高考网项目的最终效果比较满意,经受住大流量的查询与登录。其关键就在于:局部高可靠性、负载均衡器高可靠,真实服务器高可靠、共享文件系统及数据库高可靠。通过以上几点要素整合而成整体的高可靠。