道里项目的开源工作（2009开源中国开源世界大会演讲全文）

时间：2009-07-07 来源：linux论坛

毛文波：各位来宾、各位领导：下午好！
我先切回到XP，这是很好的机会，跟大家汇报一下道里开源工作，尤其是2009年的工作，实际上在去年的会议上也报告过这项工作，今年感觉到很多人都开始讲云计算，去年的时候好象还不是这样，我的标题上虽然没提云，实际上也是跟云相关的，道里是开源的项目，去年也许没有用云这个字，也许用了网格，我们做的事情的确就是云。
道里OpenSource Project，一开始是EMC中国实验室和大学合作的项目，基于服务架构上把东西放服务器上，由服务提供商提供，显然有安全的问题，项目主要是讨论可信和安全。道里开源项目今年也有了新的发展，原来是和中国几所顶尖大学合作，现在合作范围扩展了，有公司用户加入进来了。
这是去年的情况，我们项目主要有以下几个单位：EMC中国实验室综合协调参加项目，我们选择了用开源，因为我们考虑在大学同学是我们最好的研究帮手，最好的激励他们进行有创造力的研究是让他们能够发表，所以我们选择了开源，经过一年多时间，我们有一番体会，的确像我们原先想的，大学同学和教授热情都很高，他们非常支持，因为这是开源的，而且是卷起袖子大家一起干。一开展我们的合作伙伴是复旦大学，主要做虚拟化，我说我们这个项目和云有关，大家都讲虚拟化和云是不可分割的，很多人会问云和网格到底有什么差别，这个问题的确很难回答，在这方面，我们继承了华东科技大学的研究工作，很多人说云的第一个困难是安全问题，的确，我们很早就看到了这方面问题，所以我们和武汉大学合作，在云存储方面清华大学给了我们很多启示，我介绍这些内容，并不是我早就预料到云，云也不是什么新东西，云离不开存储，两年前我们把这些要素都包括进来，不是来个事后诸葛亮，基于服务架构的云也好，网格也好，有许多很重要的研究问题，我们在两年前把这些研究问题都看到了。
今天的所有报告都告诉我们云计算和开源有很好的交集，交集在服务上，今天早上Jim Zemlin的报告实际上也很明显的说到这个问题，一个是基于服务开源，刚才好几位报告者都说了，开源卖不了版权，开源应该做服务，云也是做服务，开源和云计算有很好的交集。我们为什么要讨论安全、可信呢？因为安全、可信是很重要的，第一，首先要回答你的数据在哪里？谁管理你的数据，由于数据和计算都发生在后台，和前端是有连接的，基于服务架构，把一个服务器虚拟给许多人使用，这样可以节流，很重要的一件事就是要把它们隔离开，不能弄错，你必须当心你的数据在公共服务平台说不会被别人窃取，我们知道有很多方法可以窃取别人的数据，哪怕在虚拟化情况下，仍然可以跳过，因为大家用的都是公共的硬件平台，安全是很重要的。第二，比如服务器虚拟化，这些都应该只能叫节流部分，云计算不能只回答这么一个问题，只节省开支还是不过的，尤其在开源里，节省开支只是一小部分，过去来说，钱很简单，就在你的产品上，在硬件产品或者软件产品上，用的人不买，买的人不用，如果能回答这个问题，那就比较高级了，这是开源，想办法获得市场，钱是有，关键是怎么到你口袋里，其中也包括安全和信任的问题，怎么样使得用户能够愿意使用，这两个问题是道里这个项目很感兴趣的问题，怎么样做到可信和安全。
跟云有关的是这么回事儿，大家都在叫云，过去一、两年里突然热起来，但是我不相信一晚上我们的计算全变成云了，在工业界从来没有发生过这样的事情，从来都是逐渐变化，很重要的问题云上跑的，后端是不是已经准备好了，考虑到这些问题的方案才是可以被接受的。
刚才讲很多情况下要做到隔离，这是大家都知道的办法，用虚拟化，在一个硬件平台上虚拟出很多虚拟机，有的虚拟机看起来像Windows，有的虚拟机看起来像Linux，为什么呢？因为它们之间产生了很好的隔离，如果没有隔离，可能会崩溃。云发生以后，OS很有可能还是旧的，OS的发展应该慢于云的发展，刚才看到Windows7又起来了，总的来说有个跨度，比如我们都看到Vista就没有很成功的时间，需要时间，有时候不一定能被用户接受，Linux版本一个个起来，都是往前发展的，很重要一件事就是现有的OS必须能够被安全的使用，使用它的服务功能，在安全方面不是可信的，虚拟化是可信的，用它隔离客户OS。道里很重要的一件事就是安全的隔离不光是VM之间，而且是应用和客户OS之间。我们又考虑了Intel最新的工作，过去X86平台上不是完全可以虚拟化的，过去由于X86硬件的不完善，虚拟化是很难的工作，最近业界把虚拟化重新做了一下，把硬件平台重新做了一下，打了补丁，这实际上就是VT工作，包括VTD或者IOMMU，MMU就是内存虚拟化的一种管理，大家都用一块内存，但是隔离工作很重要，MMU原来是做操作里的，IO什么意思呢？刚才说到把数据放后台运行，光有很好的OS理念做成MMU虚拟化，把不同用户所用的内存进行严格隔离，但是还有一个IO，在平台上很多外部设备也都具有CPU一样的功能，可以直接访问主内存，直接访问主内存不受CPU管辖，这是很不对的一件事，原先考虑效率，IO速度很快，CPU做起来是指令。在虚拟化环境下，如果大家都可以访问主内存，不受CPU控制，会把机器搞垮掉，所以业内修改了一下，我很感谢Intel工作，他们把VTD做完以后也做了一个PUC，道里也要做一个PUC，Intel只做了一般的IOMMU，道里要重新做一遍，做完以后效果很好。
刚才说的那些都是功能方面的，有些是行为规范的事，为什么VTD能够有效的管理，把无政府主义状态井井有条的管理起来需要软件可信，用平台上独立的硬件TPM，TPM能对进入平台的软件进行度量，这样就把软件固化了，在这个平台上运行的软件是可信的，这项工作对云计算的安全很有用。过去一些应用要在新的平台上也要能够运行，我介绍了OS的情况，反过来，过去的应用在新平台上也要能运行，在安全领域，可以有一个口令进入你所允许的网页，你要进入网页，你要输入口令，程序很简单，如果口令正确就允许你通过，如果口令不正确，你不允许通过。在安全方面是很弱的，把口令条件去掉就不进行这个判断，谁都可以进去，对软件来说根本看不见有攻击的存在；反过来，把内存用VTD进行道里保护以后，DMM进不去了，原来看上去很弱的软件在新平台上没有问题，不需要重新编译，直接运行就可以，想从底下攻击也做不到了，要把旧平台的不足之处屏蔽下去。
最后介绍一下我们今年的安排，我们原来和大学合作，得到了很好的结果，我们和因特尔同事有很好的合作，TXT是因特尔可行计算的一个项目，因特尔应该是CPU提供商，验证代码可以放到CPU里；我们还和中兴集成有很好的合作，做可信密码模块，我们和他们合作，把我们的东西移植到让TCM也能工作；很多东西直接来自于用户，用户跟你直接交流，可以把他的需求直接告诉你，我们很快就可以满足他的需求，最近铁道部找到我们，说铁道部有很多数据中心，其中很多数据中心是过去的，他们要把数据中心变成新一代的，下一代数据中心要有迁移，铁道部有19个数据中心，一个在北京，是部里的，还有18个是路局的，这些数据中心都要用到云计算和可信计算，今后数据中心如果全连好了，完全可以把多余部分作为服务提供出去，这是很有创意的想法，我们认为应该是值得一试的。我们做了一些开源的代码，计划今年下半年要开始做开放工作，我们认为把这些源代码开放出去，对我们自己知识的扩大有好处，有可行计算部分和虚拟化部分。
我今天的汇报到此结束，谢谢！