memcached在大负载高并发网站上的应用

时间：2009-03-13 来源：nianzong

大家可能对memcached这种产品早有了解，或者已经应用在自己的网站中了，但是也有一些朋友从来都没有听说过或者使用过。
这都没什么关系，本文旨在从各个角度综合的介绍这种产品，尽量深入浅出，如果能对您现在或以后的工作有所帮助，笔者将感到无比荣幸。我要介绍的内容包括以下几个方面：
1、memcached的简介
2、memcached的应用场景
3、memcached的安装
4、memcached的使用
5、memcached的部署架构
6、memcached的局限性
7、memcached的改进一、简介
1.1 背景
    memcached是一个高性能、分布式的内存对象缓存系统。
    memcached广泛应用在大负载高并发的网站上，是一种非常成熟的产品（称为一项技术也未尝不可）。像 facebook，youtube,yahoo,sina，sohu，netease，豆瓣等网站均或多或少使用了该项产品。memcached在以用户为中心的网站上，表现尤其突出，例如sns,blog等web2.0应用的站点。这些站点一般来讲，特别注重用户体验，用户对服务器的响应速度要求很高，用户数据相对比较复杂、关连度比较高，需要经常对数据库进行更新和检索。
    memcache是danga.com几个开源项目中的一个，最初是专门为livejournal.com站点而开发的，当时这个站点日pv达到了千万级，在使用过程中出现了很多的与负载和响应速度相关的问题，于是开发了这个项目，旨在改善网站当时的困境。memcache可以应对任意多个连接，使用非阻塞的网络IO。它的使用非常简单和方便，最常用的功能不超过5个方法。 memcache官方网站：http://www.danga.com/memcached。 1.2 特点
    1、高性能
     无论哪一种数据库dbms(mysql,oracle,mssql,db2,Postgres等等)，再怎么优化，最终也避不开与慢速的存储介质（硬盘、磁带）进行数据交换，但往往一旦涉及到了存储介质的io操作，存取性能就会急剧下降。memcached，顾名思义，它的全部操作自始至终都是在内存中进行的，所以存取数据的效率非常高。
     当然，通常情况下，大型网站对于数据库的操作都会做优化。通常的手段有两种：
     a、读写数据分离，采用主/辅库的方式，来分散数据库的压力，提高查询速度。
     b、按照业务特点横向或者纵向分割数据库。简单来讲，就是大库变小库，大表变小表，来提高数据库访问的效率。一般来讲，一个数据库具有很多表或者一张表有 N多的记录，都会明显的降低数据库的服务能力，比如mysql数据库单表记录达到2000万条左右（笔者以前的工作经验），性能会下降到几乎无法忍受。关于数据库的设计和优化，我们以后可以单独做一个专题，这里不做太多的研究。
     数据库会在以下情况下会出现访问瓶颈：
     a、事务操作
     企业级的数据库（比如mysql的innodb模式）都支持事务操作。由于事务具有原子性，事务中涉及的数据表在运行过程中将会加锁。在这种情况下，访问这些表的数据会出现延迟。
     b、数据更新
     数据库中任何的表在数据更新过程中，同样会被加锁。在这种情况下，也会出现上面同样的结果。
     memcached的操作基本上就不会存在以上情况（实际上也有加锁的情况，在后面再详细探讨），所以它的性能非常高。官方网站上对它的正式评价是very fast。事实上也是如此，相关的实验室测试对比结果，大家可以到网上搜索一下，比比皆是。     2、分布式     所谓分布式系统比较专业的解释是：
    一种计算机硬件的配置方式和相应的功能配置方式。它是一种多处理器的计算机系统，各处理器通过互连网络构成统一的系统。系统采用分布式计算结构，即把原来系统内中央处理器处理的任务分散给相应的处理器，实现不同功能的各个处理器相互协调，共享系统的外设与软件。这样就加快了系统的处理速度，简化了主机的逻辑结构。 memcache的分布式特性主要表现在两个方面： a.memcache客户端mc和服务器端ms可以单独安装在任何独立server上。
当然部署在同一台server上也没问题，甚至于一台机器上可以部署n个memcached。
b.memcache服务器端ms可以安装在任意数量的server上，提供并行存储和计算的能力。
这是分布式特性的本质体现。ms可以形成任意多台server组成的集群，为mc提供服务。
1.3 用途
    1、提高系统的并发能力
    2、减轻数据库的负担
    这两种用途其实非常容易理解。由于memcached高性能，所以可以同时服务于更多的连接，大大提高了系统的并发处理的能力。另外，memcached 通常部署在业务逻辑层（前台应用）和存储层（主指数据库）之间，作为数据库和前台应用的数据缓冲，因此可以快速的响应前端的请求，减少对数据库的访问。
    以下是一个memcached部署的逻辑示意图，其中mc是指memcached client,ms是指memcached server：

1.4 工作机制
    Memcached 是以守护程序方式运行于一个或多个服务器中，随时接受客户端的连接操作，客户端可以由各种语言编写，目前已知的客户端 API 包括 Perl/PHP/Python/Ruby/Java/C#/C 等等。客户端首先与 Memcached 服务建立连接，然后存取对象。每个被存取的对象都有一个唯一的标识符 key，存取操作均通过这个 key 进行，保存的时候还可以设置有效期。保存在 Memcached 中的对象实际上是放置在内存中的，而不是在硬盘上。Memcached 进程运行之后，会预申请一块较大的内存空间，自己进行管理，用完之后再申请一块，而不是每次需要的时候去向操作系统申请。Memcached将对象保存在一个巨大的Hash表中，它还使用NewHash算法来管理Hash表，从而获得进一步的性能提升。所以当分配给Memcached的内存足够大的时候， Memcached的时间消耗基本上只是网络Socket连接了。
    Memcached按照LRU方式调度数据。LRU是Least Recently Used的缩写，即最近最少使用页面置换算法，是为虚拟页式存储管理服务的。LRU算法在实际的工作环境中会与操作系统相关，比如32位的操作系统，最大的寻址空间是4G,如果当前内存的使用超过了这个限度，将被调出内存，内存中总维持最新最常用的数据。64位操作系统大大扩展了内存的寻址能力，所以现在很memcached服务都是运行在64位系统上。

写这篇文章之前，我也特意跟以前的同事做了一些交流，在此感谢sina xiangdong、kingsoft zhangyan和yahoo luke。另外，还有网上的朋友对我上一节的文章发表了许多有建设性评论，在这里一并感谢。        memcached最吸引人的地方主要在于它的分布式。分布式对于互联网应用来讲，按照用途基本上可划分为三种方式：分布式计算、分布式存储和两者兼而有之。memcached是分布式存储的一种。我们常见的分布式存储大多数是将N台设备（server或者单独的存储）构建成盘阵，而memcached旨在构建一个高速的内存池。更通俗一点来讲：分布式计算是将N颗cpu组装成一颗cpu，分布式慢速存储是将N个硬盘组装成一个大硬盘，memcached 是将N块内存组装成一块大内存。        有个朋友问：那是不是代价很昂贵啊。我的回答是肯定的。如果你的网站规模只有三两台服务器的话，我觉得你就不用考虑这样的方案了，等你的网站做大了以后，再参考这方面的资料即可。一般都是比较大的互联网公司为了追求更好的用户体验，才进行这方面的投资，对他们来讲，用户体验至上，money是小case。
还有朋友问：有一些dbms提供内存表的功能，比如mysql的内存表，可以代替memcached。但我要建议你的是：mysql的内存表确实起到同样的作用，但它的局限也很多，往往不能让你随心所欲，所以建议你不要走弯路。
二、memcached的应用场景 2.1 应用范围
    memcached产品或相关技术的应用，我们在前面已经提到了一些。其实它的应用还是非常普遍的，应用作为广泛的领域：例如sns类网站、blog类网站、bbs类网站以及im后台服务。

2.2 sns类网站的应用
    livejournal.com是99年始于校园中的项目，有点像中国的校内网。几个学生纯属出于爱好做了这样一个网站,主要实现以下功能： sns、blog、bbs和rss等。livejournal从建立开始就采用了大量的开源软件，到现在它本身也衍生了不少开源软件。 sns网站，现在比比皆是，规模比较大的象开心、校内、51，它们的页面上往往需要引用大量的用户信息、好友信息以及文章信息等，所以跨表或跨库操作会相当多。如果这些功能全部直接操作数据库，显然会带来极大的效率损耗和系统负载。memcached在这样的场景下就会发挥巨大的作用，它采用大内存把这些不变的数据全都缓存起来，当数据修改时就通知cache过期，这样应用层基本上就可以解决大部分问题了，只有很小一部分请求穿透应用层，用到数据库。 2.3 blog、bbs类网站的应用
   象blog.sina.com.cn这些流量巨大的blog系统，它需要频繁读写的一些小数据。其中最典型的应用，我们通常成为“数字类服务”，比如 blog中需要实时显示的用户点击数和阅读数，bbs中需要记录的在线人数、在线用户等。这些小数据的处理非常繁琐，你无论怎么去设计数据库，都很难避开跨表或者跨库。有的朋友会说，可以在数据库中增加冗余字段解决这类问题，但事实上，这既不符合数据库设计的范式规则，也很难做到数据的一致性，由此会引发更为复杂的问题。而且由于产品线的分散发展，数据已经很难做到完全的统一规划。memcached在这样的场景下就会将这些小数据进行缓存，定期持久化就可以了，查询操作一直都在内存中运行。说到这里，有的朋友又会想到一些其它的问题：“memcached server宕机了怎么办，怎么保证与数据库的数据一致”。我会对你说：“你的问题非常好，我们将会在后面章节给出相应的解决方案”。另外，其实这种小数据并不是关键性数据，即使偶尔发生点错误，也没太大的问题。blog、bbs系统并不是严格的企业级系统，假如你是为银行业务提供解决方案的话，memcached并不适合。 2.4 im server的应用    前些时间，有一些文章介绍memcached 在Jabber上应用。写累了，喝口水，读者自己去找找资料吧，有时间的话，帮我补上吧，呵呵。
   我们举了几个例子来说明memcached的应用场景，似乎都局限于小数据服务，那是不是就不能用于较大数据的缓冲了？那绝不是，memcached能够用来存储各种格式的数据，包括图像、视频、文件以及数据库检索的结果等等，而且生产环境中就这么跑过，只不过让大数据量使用缓冲的话，有点太浪费了，同样数量的内存存不了几条数据，所以会明显的降低命中率。

待续...