我来谈谈“去IOE”

jopen 10年前

  什么是“去 IOE”?对这个问题,我有两个答案。

  第一个答案,是指 IT 架构的更新换代,具体说就是以 IBM 为代表的主机、以 ORACLE 为代表的关系型数据库,以及以 EMC 为代表的高端存储设备,被新型的云计算技术所替换,也就是我们常说的“云化”。其中,主机被 X86 设备所取代,传统数据库被开源数据库产品替换,而 SAN 结构的高端存储也受到云化的存储产品和体系的冲击。这三方面中任何一项工作,都可以被冠以“去 IOE”的具体表现。

  第二个答案,是指针对外国 IT 设备,特别是美国产品的“严打”,减少甚至不再买 IBM、ORACLE、EMC 等企业的产品。棱镜门事件曝光之后,有报道称,思科、IBM、谷歌、高通、英特尔、苹果、甲骨文、微软并成为美国的“八大金刚”,他们一方面与美国政府、 军队保持着紧密的联系;另一方面在中国长驱直入,占据众多关键领域,导致美国情报部门通过这些设备、软件、网络获取信息,给中国的信息安全带来巨大威胁。 “去 IOE”与设备采购国产化、自主研发等口号挂钩,带有一定的政治色彩。

  对于中国移动的技术人员来说,即使不出现这个“去 IOE”名词,为了解决系统架构的问题,实现基础设施的升级,系统云化改造也会是运营商 IT 技术人员的必然选择。

  早在五六年前,中国移动就着手研究业务支撑系统的云化演进问题。那时候虚拟化技术已经在系统中广泛应用,但对规模庞大的业务支撑系统实施全面的云化改造,至少面临三个问题:

  首先,是资源灵活分配与调用的问题。虚拟化技术能将大的计算资源切成小块,但这些切分出来的计算资源能否灵活调用,是否可以重新组合在一起形成 新的计算能力,还有很多技术问题需要解决。倘若资源池内无法进行系统间的灵活调配,不但达不到提升整体效率的目的,甚至可能因系统间资源调用时的产生消耗 过大,导致系统效率反而降低。

  其次,是应用软件如何与硬件的云化适配的问题。IOE 厂商在软件方面下的功夫很大,在提供附加功能的同时,也很注意提升了产品的性能和稳定性。而面对 X86 开放平台以及开源软件,很多软件需要重新开发或定制开发,应用软件的开发量增加,也给系统的稳定性带来了不确定因素。这也意味着,在新型的技术架构下,系 统软件和应用软件合一,开发者要承担双重开发工作量。

  第三,是建立与支撑系统云化配套的运行维护管理体系。引入云计算技术实现了计算资源的灵活调配,但对系统的维护管理来说,可能是引入了一场灾 难。传统的分工界面、工作流程、应急预案等等,都会随着系统云化程度的加强而逐步变化,尤其是对于软件的维护,将面临巨大的,甚至是颠覆性的考验。

  正因为面临众多的问题,移动是积极稳妥,有条不紊地进行云化改造的探索与实施。最初是接入层实施了全面的云桌面改造;之后是对 CRM 系统的接入模块和 BOSS 系统的帐详单存储工作进行云化试点。改造的内容不仅包括硬件的虚拟机和 X86 化改造,也包括基于分布式数据库和开源数据库的应用软件改造;在一些新建的生产系统中,已经全部采用云计算技术进行系统建设;而在分析系统中,分布式与开 源等方面的进展更为激进。

  尽管做了这么多工作,离全部云化的目标还有很长的路要走。一是核心的数据库服务器还不敢去小型机;二是应用软件的稳定性和性能还有待进一步验证;三是资源投入不足导致对系统的控制力差;四是跨域的资源调用,从理论到实践还有很远;等等。

  那么系统的云化升级改造与计算机设备国产化,这二者之间又是什么关系?全面替换了 UNIX 小型机、数据库,就能把国外设备连锅端么?

  世界级的计算机巨头早就基于自身的特点,通过研发和收购等方式进行云计算技术的布局,IBM 有 X86 和存储设备,EMC 旗下的 VMware 是应用最广泛的虚拟化软件,ORECLE 公司也有很多云计算的软件、技术和产品,即使全部完成系统云化改造,也不意味着这些计算机企业就没生意做了。

  另一方面,传统的小型机系统也是开放的,并非绑定某家产品。在实际的招标采购过程中,国内企业可以生产的设备,利用价格优势将海外设备供应商打 得头破血流;但是在高端计算机领域,国产设备或者没有研发出来,或者其稳定性和性能与国外设备相比差距较大,无法通过测试,因此最终的采购结果还是国外企 业中标。

  由此可以看出:如果“去 IOE”说的解决系统云化的问题,并非把系统搬到阿里云上才是正解,运营商在系统演进方面走得非常靠前;而如果通过“去 IOE”来支持设备国产化,前提是国产的设备和产品能够满足电信级运营与服务的要求。