道里项目的开源工作(2009开源中国开源世界大会演讲全文)
时间:2009-07-07 来源:linux论坛
毛文波:各位来宾、各位领导:下午好!
我先切回到XP,这是很好的机会,跟大家汇报一下道里开源工作,尤其是2009年的工作,实际上在去年的会议上也报告过这项工作,今年感觉到很多人都开始讲云计算,去年的时候好象还不是这样,我的标题上虽然没提云,实际上也是跟云相关的,道里是开源的项目,去年也许没有用云这个字,也许用了网格,我们做的事情的确就是云。
道里OpenSource Project,一开始是EMC中国实验室和大学合作的项目,基于服务架构上把东西放服务器上,由服务提供商提供,显然有安全的问题,项目主要是讨论可信和安全。道里开源项目今年也有了新的发展,原来是和中国几所顶尖大学合作,现在合作范围扩展了,有公司用户加入进来了。
这是去年的情况,我们项目主要有以下几个单位:EMC中国实验室综合协调参加项目,我们选择了用开源,因为我们考虑在大学同学是我们最好的研究帮手,最好的激励他们进行有创造力的研究是让他们能够发表,所以我们选择了开源,经过一年多时间,我们有一番体会,的确像我们原先想的,大学同学和教授热情都很高,他们非常支持,因为这是开源的,而且是卷起袖子大家一起干。一开展我们的合作伙伴是复旦大学,主要做虚拟化,我说我们这个项目和云有关,大家都讲虚拟化和云是不可分割的,很多人会问云和网格到底有什么差别,这个问题的确很难回答,在这方面,我们继承了华东科技大学的研究工作,很多人说云的第一个困难是安全问题,的确,我们很早就看到了这方面问题,所以我们和武汉大学合作,在云存储方面清华大学给了我们很多启示,我介绍这些内容,并不是我早就预料到云,云也不是什么新东西,云离不开存储,两年前我们把这些要素都包括进来,不是来个事后诸葛亮,基于服务架构的云也好,网格也好,有许多很重要的研究问题,我们在两年前把这些研究问题都看到了。
今天的所有报告都告诉我们云计算和开源有很好的交集,交集在服务上,今天早上Jim Zemlin的报告实际上也很明显的说到这个问题,一个是基于服务开源,刚才好几位报告者都说了,开源卖不了版权,开源应该做服务,云也是做服务,开源和云计算有很好的交集。我们为什么要讨论安全、可信呢?因为安全、可信是很重要的,第一,首先要回答你的数据在哪里?谁管理你的数据,由于数据和计算都发生在后台,和前端是有连接的,基于服务架构,把一个服务器虚拟给许多人使用,这样可以节流,很重要的一件事就是要把它们隔离开,不能弄错,你必须当心你的数据在公共服务平台说不会被别人窃取,我们知道有很多方法可以窃取别人的数据,哪怕在虚拟化情况下,仍然可以跳过,因为大家用的都是公共的硬件平台,安全是很重要的。第二,比如服务器虚拟化,这些都应该只能叫节流部分,云计算不能只回答这么一个问题,只节省开支还是不过的,尤其在开源里,节省开支只是一小部分,过去来说,钱很简单,就在你的产品上,在硬件产品或者软件产品上,用的人不买,买的人不用,如果能回答这个问题,那就比较高级了,这是开源,想办法获得市场,钱是有,关键是怎么到你口袋里,其中也包括安全和信任的问题,怎么样使得用户能够愿意使用,这两个问题是道里这个项目很感兴趣的问题,怎么样做到可信和安全。
跟云有关的是这么回事儿,大家都在叫云,过去一、两年里突然热起来,但是我不相信一晚上我们的计算全变成云了,在工业界从来没有发生过这样的事情,从来都是逐渐变化,很重要的问题云上跑的,后端是不是已经准备好了,考虑到这些问题的方案才是可以被接受的。
刚才讲很多情况下要做到隔离,这是大家都知道的办法,用虚拟化,在一个硬件平台上虚拟出很多虚拟机,有的虚拟机看起来像Windows,有的虚拟机看起来像Linux,为什么呢?因为它们之间产生了很好的隔离,如果没有隔离,可能会崩溃。云发生以后,OS很有可能还是旧的,OS的发展应该慢于云的发展,刚才看到Windows7又起来了,总的来说有个跨度,比如我们都看到Vista就没有很成功的时间,需要时间,有时候不一定能被用户接受,Linux版本一个个起来,都是往前发展的,很重要一件事就是现有的OS必须能够被安全的使用,使用它的服务功能,在安全方面不是可信的,虚拟化是可信的,用它隔离客户OS。道里很重要的一件事就是安全的隔离不光是VM之间,而且是应用和客户OS之间。我们又考虑了Intel最新的工作,过去X86平台上不是完全可以虚拟化的,过去由于X86硬件的不完善,虚拟化是很难的工作,最近业界把虚拟化重新做了一下,把硬件平台重新做了一下,打了补丁,这实际上就是VT工作,包括VTD或者IOMMU,MMU就是内存虚拟化的一种管理,大家都用一块内存,但是隔离工作很重要,MMU原来是做操作里的,IO什么意思呢?刚才说到把数据放后台运行,光有很好的OS理念做成MMU虚拟化,把不同用户所用的内存进行严格隔离,但是还有一个IO,在平台上很多外部设备也都具有CPU一样的功能,可以直接访问主内存,直接访问主内存不受CPU管辖,这是很不对的一件事,原先考虑效率,IO速度很快,CPU做起来是指令。在虚拟化环境下,如果大家都可以访问主内存,不受CPU控制,会把机器搞垮掉,所以业内修改了一下,我很感谢Intel工作,他们把VTD做完以后也做了一个PUC,道里也要做一个PUC,Intel只做了一般的IOMMU,道里要重新做一遍,做完以后效果很好。
刚才说的那些都是功能方面的,有些是行为规范的事,为什么VTD能够有效的管理,把无政府主义状态井井有条的管理起来需要软件可信,用平台上独立的硬件TPM,TPM能对进入平台的软件进行度量,这样就把软件固化了,在这个平台上运行的软件是可信的,这项工作对云计算的安全很有用。过去一些应用要在新的平台上也要能够运行,我介绍了OS的情况,反过来,过去的应用在新平台上也要能运行,在安全领域,可以有一个口令进入你所允许的网页,你要进入网页,你要输入口令,程序很简单,如果口令正确就允许你通过,如果口令不正确,你不允许通过。在安全方面是很弱的,把口令条件去掉就不进行这个判断,谁都可以进去,对软件来说根本看不见有攻击的存在;反过来,把内存用VTD进行道里保护以后,DMM进不去了,原来看上去很弱的软件在新平台上没有问题,不需要重新编译,直接运行就可以,想从底下攻击也做不到了,要把旧平台的不足之处屏蔽下去。
最后介绍一下我们今年的安排,我们原来和大学合作,得到了很好的结果,我们和因特尔同事有很好的合作,TXT是因特尔可行计算的一个项目,因特尔应该是CPU提供商,验证代码可以放到CPU里;我们还和中兴集成有很好的合作,做可信密码模块,我们和他们合作,把我们的东西移植到让TCM也能工作;很多东西直接来自于用户,用户跟你直接交流,可以把他的需求直接告诉你,我们很快就可以满足他的需求,最近铁道部找到我们,说铁道部有很多数据中心,其中很多数据中心是过去的,他们要把数据中心变成新一代的,下一代数据中心要有迁移,铁道部有19个数据中心,一个在北京,是部里的,还有18个是路局的,这些数据中心都要用到云计算和可信计算,今后数据中心如果全连好了,完全可以把多余部分作为服务提供出去,这是很有创意的想法,我们认为应该是值得一试的。我们做了一些开源的代码,计划今年下半年要开始做开放工作,我们认为把这些源代码开放出去,对我们自己知识的扩大有好处,有可行计算部分和虚拟化部分。
我今天的汇报到此结束,谢谢!
我先切回到XP,这是很好的机会,跟大家汇报一下道里开源工作,尤其是2009年的工作,实际上在去年的会议上也报告过这项工作,今年感觉到很多人都开始讲云计算,去年的时候好象还不是这样,我的标题上虽然没提云,实际上也是跟云相关的,道里是开源的项目,去年也许没有用云这个字,也许用了网格,我们做的事情的确就是云。
道里OpenSource Project,一开始是EMC中国实验室和大学合作的项目,基于服务架构上把东西放服务器上,由服务提供商提供,显然有安全的问题,项目主要是讨论可信和安全。道里开源项目今年也有了新的发展,原来是和中国几所顶尖大学合作,现在合作范围扩展了,有公司用户加入进来了。
这是去年的情况,我们项目主要有以下几个单位:EMC中国实验室综合协调参加项目,我们选择了用开源,因为我们考虑在大学同学是我们最好的研究帮手,最好的激励他们进行有创造力的研究是让他们能够发表,所以我们选择了开源,经过一年多时间,我们有一番体会,的确像我们原先想的,大学同学和教授热情都很高,他们非常支持,因为这是开源的,而且是卷起袖子大家一起干。一开展我们的合作伙伴是复旦大学,主要做虚拟化,我说我们这个项目和云有关,大家都讲虚拟化和云是不可分割的,很多人会问云和网格到底有什么差别,这个问题的确很难回答,在这方面,我们继承了华东科技大学的研究工作,很多人说云的第一个困难是安全问题,的确,我们很早就看到了这方面问题,所以我们和武汉大学合作,在云存储方面清华大学给了我们很多启示,我介绍这些内容,并不是我早就预料到云,云也不是什么新东西,云离不开存储,两年前我们把这些要素都包括进来,不是来个事后诸葛亮,基于服务架构的云也好,网格也好,有许多很重要的研究问题,我们在两年前把这些研究问题都看到了。
今天的所有报告都告诉我们云计算和开源有很好的交集,交集在服务上,今天早上Jim Zemlin的报告实际上也很明显的说到这个问题,一个是基于服务开源,刚才好几位报告者都说了,开源卖不了版权,开源应该做服务,云也是做服务,开源和云计算有很好的交集。我们为什么要讨论安全、可信呢?因为安全、可信是很重要的,第一,首先要回答你的数据在哪里?谁管理你的数据,由于数据和计算都发生在后台,和前端是有连接的,基于服务架构,把一个服务器虚拟给许多人使用,这样可以节流,很重要的一件事就是要把它们隔离开,不能弄错,你必须当心你的数据在公共服务平台说不会被别人窃取,我们知道有很多方法可以窃取别人的数据,哪怕在虚拟化情况下,仍然可以跳过,因为大家用的都是公共的硬件平台,安全是很重要的。第二,比如服务器虚拟化,这些都应该只能叫节流部分,云计算不能只回答这么一个问题,只节省开支还是不过的,尤其在开源里,节省开支只是一小部分,过去来说,钱很简单,就在你的产品上,在硬件产品或者软件产品上,用的人不买,买的人不用,如果能回答这个问题,那就比较高级了,这是开源,想办法获得市场,钱是有,关键是怎么到你口袋里,其中也包括安全和信任的问题,怎么样使得用户能够愿意使用,这两个问题是道里这个项目很感兴趣的问题,怎么样做到可信和安全。
跟云有关的是这么回事儿,大家都在叫云,过去一、两年里突然热起来,但是我不相信一晚上我们的计算全变成云了,在工业界从来没有发生过这样的事情,从来都是逐渐变化,很重要的问题云上跑的,后端是不是已经准备好了,考虑到这些问题的方案才是可以被接受的。
刚才讲很多情况下要做到隔离,这是大家都知道的办法,用虚拟化,在一个硬件平台上虚拟出很多虚拟机,有的虚拟机看起来像Windows,有的虚拟机看起来像Linux,为什么呢?因为它们之间产生了很好的隔离,如果没有隔离,可能会崩溃。云发生以后,OS很有可能还是旧的,OS的发展应该慢于云的发展,刚才看到Windows7又起来了,总的来说有个跨度,比如我们都看到Vista就没有很成功的时间,需要时间,有时候不一定能被用户接受,Linux版本一个个起来,都是往前发展的,很重要一件事就是现有的OS必须能够被安全的使用,使用它的服务功能,在安全方面不是可信的,虚拟化是可信的,用它隔离客户OS。道里很重要的一件事就是安全的隔离不光是VM之间,而且是应用和客户OS之间。我们又考虑了Intel最新的工作,过去X86平台上不是完全可以虚拟化的,过去由于X86硬件的不完善,虚拟化是很难的工作,最近业界把虚拟化重新做了一下,把硬件平台重新做了一下,打了补丁,这实际上就是VT工作,包括VTD或者IOMMU,MMU就是内存虚拟化的一种管理,大家都用一块内存,但是隔离工作很重要,MMU原来是做操作里的,IO什么意思呢?刚才说到把数据放后台运行,光有很好的OS理念做成MMU虚拟化,把不同用户所用的内存进行严格隔离,但是还有一个IO,在平台上很多外部设备也都具有CPU一样的功能,可以直接访问主内存,直接访问主内存不受CPU管辖,这是很不对的一件事,原先考虑效率,IO速度很快,CPU做起来是指令。在虚拟化环境下,如果大家都可以访问主内存,不受CPU控制,会把机器搞垮掉,所以业内修改了一下,我很感谢Intel工作,他们把VTD做完以后也做了一个PUC,道里也要做一个PUC,Intel只做了一般的IOMMU,道里要重新做一遍,做完以后效果很好。
刚才说的那些都是功能方面的,有些是行为规范的事,为什么VTD能够有效的管理,把无政府主义状态井井有条的管理起来需要软件可信,用平台上独立的硬件TPM,TPM能对进入平台的软件进行度量,这样就把软件固化了,在这个平台上运行的软件是可信的,这项工作对云计算的安全很有用。过去一些应用要在新的平台上也要能够运行,我介绍了OS的情况,反过来,过去的应用在新平台上也要能运行,在安全领域,可以有一个口令进入你所允许的网页,你要进入网页,你要输入口令,程序很简单,如果口令正确就允许你通过,如果口令不正确,你不允许通过。在安全方面是很弱的,把口令条件去掉就不进行这个判断,谁都可以进去,对软件来说根本看不见有攻击的存在;反过来,把内存用VTD进行道里保护以后,DMM进不去了,原来看上去很弱的软件在新平台上没有问题,不需要重新编译,直接运行就可以,想从底下攻击也做不到了,要把旧平台的不足之处屏蔽下去。
最后介绍一下我们今年的安排,我们原来和大学合作,得到了很好的结果,我们和因特尔同事有很好的合作,TXT是因特尔可行计算的一个项目,因特尔应该是CPU提供商,验证代码可以放到CPU里;我们还和中兴集成有很好的合作,做可信密码模块,我们和他们合作,把我们的东西移植到让TCM也能工作;很多东西直接来自于用户,用户跟你直接交流,可以把他的需求直接告诉你,我们很快就可以满足他的需求,最近铁道部找到我们,说铁道部有很多数据中心,其中很多数据中心是过去的,他们要把数据中心变成新一代的,下一代数据中心要有迁移,铁道部有19个数据中心,一个在北京,是部里的,还有18个是路局的,这些数据中心都要用到云计算和可信计算,今后数据中心如果全连好了,完全可以把多余部分作为服务提供出去,这是很有创意的想法,我们认为应该是值得一试的。我们做了一些开源的代码,计划今年下半年要开始做开放工作,我们认为把这些源代码开放出去,对我们自己知识的扩大有好处,有可行计算部分和虚拟化部分。
我今天的汇报到此结束,谢谢!
相关阅读 更多 +