英特尔IT云计算战略
2011年8月18-19日,由ITValue主办的2011“IT价值峰会”在三亚召开。英特尔IT云计算项目经理胡寅玮进行了题为《英特尔IT云计算战略》的演讲。以下为演讲内容实录。
胡寅玮:大家好!我跟大家分享一下我们是怎么理解云计算的。这两天的精彩讲座当中被频繁的提到云计算客户的体验,怎么满足灵活性、高效性,这里面可以反映出一个趋势,在我们计算机工业不仅只是硬件,虽然硬件很重要,但是硬件和软件的结合和软硬件的服务和最终的终端这一系列都是紧密的结合互相作用,对于英特尔这样的公司,我们还是持续的为业界提供解决很好的方案,我们怎么顺应这样的趋势,给大家提供服务。主要是在几个方面,一是不断提高硬件平台的能效,用越来越少的能源消耗获得越来越高的性能,这主要是对我们硬件产品的设计,另外是安全性。最初的时候,计算机网络的安全主要是靠病毒的杀除,如果安全软件的结合要识别,如果不是就在这上面运行。
今天我要涵盖的内容我会重点的讲一下我们在实施内部私有云的实践,同时再带来一个案例分析,最后总结一下我们对未来的挑战。
作为英特尔的IT,我们面临一个挑战的环境,像这样的公司,现在必须要适应新的潮流,能够更好的设计出符合大家说的给用户带来最佳体验的基于服务的移动性非常好的计算解决方案,我们的硬件不断的满足大家的需求,对于IT来说,我们怎么支持我们公司完成这样的任务,对英特尔的IT,我们的定位是这样的,IT就像是芯片一样。我们怎么使员工的创造性和合作性提高,尤其是园林施工战略伙伴之间的合作性。我们同时还有一些软件的业务在里面,我们IT服务不只是适合用我们的芯片,还有提高业务的效率,指的是流程的自动行,这主要是芯片方面,我们芯片工程的自动化,包括我们做决策,怎么更好的利用BI这些系统给管理层做决策,还有灵活性和高效性,我们不只是看IT的成本,同时看IT怎么灵活的适应商业的变化等。
这里是IT的统计数据,我们面临着环境真的很挑战,我们有6300名的IT员工,分布在不同的网点,我们全球有90000名英特尔员工,有91个数据中心,测定有150个数据中心。从2005年开始,我们不断的整合数据中心,数量上大大的减少了,但是性能和容量不断的提高,现在变成91个,现在目前的服务器运行大概是75000个,另外,除了服务器之外还有一些设备,像个人电脑、手机设备大概有10万多个,电脑主要是移动方面的。与此同时,我们还有视频会议环境的部署,我们也在加快,我们有越来越多的芯片的设计师。我们合作设计除了传统的电脑上的带录像摄像头的方式已经不能满足我们的要求,2009年之内,我们大概有2万小时合作的时间,这个合作是除去开会打电话的时间,纯粹的2万个小时合作时间是通过视频进行的。
在数据中心,我们几乎支持了所有英特尔的业务,这里分出五类,一个是我们设计芯片的CG流,还有一个是office办公,还有我们的生产,我们的生产是很重要的一块,因为一旦不能完成或者是出了问题,直接影响到我们的销售额,还有一个是企业的应用,像ERP这些东西,还有一个是对外的业务,其中有70%的计算资源是被我们芯片设计业务给消化掉了,剩下的30%分散在ONE这些业务,我们可以看到芯片设计的增长率每年以45%的速度在增长,就是为于他的需求。我们对于云计算业务的驱动因素有几块,跟各位这几天分享很多公司对云计算的需求是差不多的,我们希望云计算给我们带来高效性,资源利用率能够有效的提高,并且资源的利用是可被检测的,不是一笔糊涂帐,能够可计量的,我们希望能够灵活性,灵活性就是基础传统IT的部署模式,能够让大部分人按需的方式获取IT的服务,因为还有核心的考虑,还有可用性,这方面不能宕机,不能有问题。云计算的概念出来了以后,对我们来说,我们怎么接受这个概念理解这个概念然后改变 IT环境,我们一开始进行了网云的转换,主要是为全球的芯片设计提供了网格计算的环境。这么说,从今天角度来看不完全是云,可以说有一点云的特殊在里面,有一个门户,能够按需获取计算资源,同时里面有资源的概念,能够共享,但是里面的虚拟化并不是一开始就有的,一开始全是硬件,只是这些硬件是一模一样的,很容易进行迁移,渐渐的开始,当我们的虚拟技术不断提升,信誉不断的增加就开始有一些东西在虚拟的环境里面运行了。从2006年开始,一开始资源的利用率只有19%,因为大家都各自为营,买的东西也没有标准,因为也考虑到未来的业务需求,拼命的买了很多,以便一时之用,这种利用率非常多,后来经过了网格的部署以后,到了2009年我们达到了90%的利用率。总的来说,我们总共有2亿美元的商业价值,我们不用建越来越多的数据中心,不用买很多不必要的计算资源。这里,我们主要是硬件,硬件怎么能够让基础架构服务,同时,我们也有一些东西在上面,在这个基础上,我们进行了五努力,我们把我们的Office也开始的转换,我们是一步一步的进行的,在这个过程中,我们的云计算的战略分两条线。
我们用的方法是自内而外,我们把计算环境转到云上,我们把办公的环境也转到云上,将来传统的环境可能有一些传统的环境,但是把它保持在非常小、非常有限的范围内,同时我们有选择的使用公有云,对我们来说,我们英特尔对公有云的使用持非常谨慎的态度,主要也是考虑到安全性,我们主要采用的是把非独特的,非竞争性或者是一种业界已经很标准的东西逐渐的往公有云上,比如说员工福利、报销、销售。在公有云和私有云的权衡方面,这是我们目前的使用原则,我们把大部分的应用托管在自己的私有云里面,公有云就像刚才讲的,可以托管业界已经比较标准的通行的非竞争性的东西,我们觉得构建私有云可以实现公有云上面的诸多好处,比如说灵活性,同时也可以规避掉一些风险,尤其是一些跟商业机密、安全性带来的风险。我们主要是平衡三个方面,一是总体的拥有成本,一个是能效,还有一个是性能效益,还有一个是数据安全。能效也是这样的,我除了考虑到成本,还要考虑到效率,我有些是跟外部连接,数据的传输方面的一些性能也要考虑。
这是一个决策,当我往云上转换的时候,我怎么决定是外部的云还是内部的云,这个我们还在不断的改进,没有一个通用的公有云,这个是不是最高机密的东西,还有关键性的,还有对网络带宽有苛刻的要求的,这个是私有云。如果已经是行业的标准的工作,又不用太多的定制,比如说,我们的报销是分包给供应商做的,还有福利制度这些东西,因为业界已经有标准了,我们没有必要自己建这样一套东西,这样就可以走到公有云上,如果是非常个性化和我们的环境密切结合的,我们往私有云上面走。所以基本上是这样。
还有一点要提到很重要的一点,大家谈云的时候,比较多的谈到服务器,网络,存储,数据中心,事实上,云这个东西是服务的,是面向客户,是考虑客户的用户体验的,我只是考虑数据的终端是不够的,我的客户端是什么样的,客户端的模式是什么样的,这是会影响到你的决策的,就以安全性来说,都是在有限的环境连接,都是PC上的,如果现在员工都能够看Email看一些数据,这样我们的安全机制做得不好,就很有风险,还有一个问题,同样的应用,比如说,媒体方面的应用,有限网络的PC上达到某些效果,如果在终端上是无线的连接,又是无时无刻的连接,这样对网络带宽的要求是更加高的要求,这对我们云计算的策略是有很多的考虑在里面的,我们又提到服务器和桌面的虚拟化,这是两个关键的因素,都必须要同时考虑。
公司会觉得为什么部署这个,或者说为什么购买一些先进的设备,你的价值在哪,我们设计我们的策略的时候,不能光看这个技术上有多好,或者是这个将来怎么样,我们还要看商业价值,我们建议一开始的时候,你们必须定义好云计算的价值将来是怎么评估的,我们基本上是看这四个方面,成本、业务效率、人员效率,服务质量。我们确保按阶段进行,不是一夜之间完成,同时要能够有可计量的服务,如果不能计量的话,到后期很难管理,因为计量就无从谈起。
这是我们的私有云,我们希望我们内部的私有云变成这个样子,现在还在进展中,我信心很多公司都差不多,我们把基础设施变成基础设施服务,能够虚拟硬件,同时又一些整合,然后在这个基础之上有平台服务,在上面是面向客户的各种各样的应用模式,像自助式的服务。这里我们也划分了阶段,这个不能近期一下子完成,近期我们主要是侧重在一个虚拟化,这是一个基础,还有一个是按需自助服务,同时还要把服务可计量。中到长期的目标,在这个基础上能够有一些商业技能的解决方案,能够有更好的业务决策,同时我们还考虑到其他方面,像公有云和客户端感知的服务,当一个客户端连进去的时候,可以检测到这是一个什么样的终端,可还要可以检测到什么地方,比如说,我们当时说了,我们有些区域英特尔的内部是不能拍照的,现在每个人都有手机,手机都有拍照的功能,我们手机进入到我们公司内部跟我们网络连接的时候,他可以感受到我在什么区域了,比如说,禁止掉手机的拍照功能,这只是举个例子。就像刚才我们说的,我们现在还是在虚拟化方面的建设,虚拟化的比例在不断的提高,我们的虚拟化是借助服务器更新的周期来完成的,每四年更新旧的服务器,如果是以前的服务器我们就考虑能不能虚拟化,这里就有一个决策。针对要虚拟化的机器,我们不可能一种虚拟服务器就满足了所有,这是不可能的,里面还有具体的东西,包括我们配什么样的物理机,我们对于不同的型号,大中小不同的型号,我们规定好密度。这里除了虚拟化以外,还有按需自助的服务,比如说,软件工程师的使用模式和芯片工程师使用的模式和销售员使用的模式是不一样的,说起来容易,我怎么让他们自助按需服务,不同的业务需要不同的模式,这样我们都走一个可行性的验证。这样可以看出一前一后的比较,以前是手工供应的,后来是自助的服务模式,利用率大大提高,业务提供的速度完全提高,时间大大的减少。基本上是这样,我们有一个自助服务的门户网站,有些芯片工程师也是可以获取资源,同时在后台我们有容量监控和一些决策的机制站,决定怎么部署,同时还产生一些商业智能的报告,就像我们管理供应链一样,有这方面的分析。
我们的成果虚拟化得到大的提高,灵活性大大提高,从原来部署一个环境大概90天3个月,现在基本上3个小时就可以完成。
这是一个案例分析,我之所以选择这个案例,这是我们内部私有云成功的案例,这是一个测试云,因为我们中国的IT在这当中出了非常大的贡献,我们的开发者团队都是来自IT的。芯片设计阶段设计出来以后,还要同步开发一些系统级的软件,这是非常昂贵的硬件,这个硬件的资源是非常稀有的,很多工程师都用这个硬件,但是有很多的麻烦事在里面,我们后来发明了这样的测试云,他们里面既有虚拟的系统,也有一个硬件农场的概念,这些东西可以在不同的地点,通过一个虚拟网络把这些东西连起来,这样就成为一个虚拟的实验室环境,这个虚拟的实验室环境里面,我们的测试公工程师和软件开发工程师到里面进行测试,用完了以后,再把它释放。带来的商业价值已经获得超过2万美金的价值。
最后我总结一下未来的挑战,未来对我们来说,在这四个方面有挑战,一个是安全性,另一个是RAS,可靠性,可维护性。有的时候发现虚拟环境里面CPU是跟得上的,网络的I/0就不行了,我还有一个是绿步,我们不断的追求新的目标。
个人简介:
Vicky Hu is the IT Program manager in Intel Asia-Pacific R&D Ltd, responsible for driving the Design Cloud Program in global IT Engineering Computing group to enable private cloud computing solution for Intel silicon design and software development groups. Prior to this, Vicky had worked on various technical and management positions in Intel R&D and Information Technology groups. She has over 10 years of experience in IT industry, be professional in software product development, IT infrastructure & service management, project/program management and engineering team management。