云数据中心发展现状及趋势
企业级云平台需要支持不同维度、不同层次的异构环境,需要硬件资源的多样化并动态匹配上层应用的需求.
过去10多年,数据中心无论是在技术上还是部署上都极速发展,变化也快,但粗略来说可以将其划分为3个阶段:第一阶段是以数据中心大集中(Data Center Consolidation)为主的DC 1.0;第二阶段为利用资源虚拟化(Virtualization)和服务动态管理(Dynamic Service Orchestration)为手段,以增加资源共享利用率和资源部署灵活度的DC 2.0,上述两个阶段技术上最大的分野为云计算技术的日趋成熟和大批量部署;第三阶段的DC 3.0是为了适应目前特别是大型网站(OTT)数据处理急速增长的业务需求而产生的,而其中大部分技术业界还在预研阶段,有很大程度的不确定性。
观点1:云安全事件的影响集中在公有云
近年来,一系列云安全漏洞事件的曝光引发了业界对云安全的担忧,其中涉及的不乏像苹果的iCloud和亚马逊的AWS这样的知名云服务。但这并没有影响企业用户部署云计算平台的步伐,从我们了解的情况来看,各国客户云计算平台的部署反而加快了,当然主因是云计算平台技术(特别是IaaS)日趋成熟,让用户可以放心部署,但信息安全对云计算部署的步伐并没有太大影响也是事实。
云安全事件的影响集中在公有云,主要体现在“大企业向私有云倾斜”和“公有云数据本地化”两个方面。首先,大企业特别是政府在公有云与私有云的选择天枰上一边倒地向自建私有云倾斜,受其影响所致,公有云、私有云市场分工定位也越趋明确——公有云主要对象为网站类型的初创公司(Startup)以及中小企业,其中尤以中小企业近两年发展最为快速;而私有云的主要对象则为政府和大企业;而所谓混合云(Hybrid Cloud)的发展和部署主要立足点还是私有云为主、公有云为辅(观点4会进一步阐述)。不难想象,这种情况在美国以外的市场尤为明显,而这种业务格局短时间内(至少2-3年)不容易打破。
其次是数据本地化,出于安全考虑公有云客户(又或是政府)要求数据留在本地(国)。最近一些第三方数据显示公有云业务在美国以外(特别是西欧)的增长远超美国本土便是明证。数据本地化加上开源(Open Source)带给美国以外各国本地IT产业一个前所未有的发展机会,不知道会否导致ICT产业的百花齐放,打破长久以来一国独大的局面。
观点2:云计算部署热点在IaaS,而OpenStack稳操胜券
无论选择公有云还是私有云,用户现阶段部署的热点在IaaS,只有非常少部分用户在考虑PaaS,这和用户需求以及各种技术的成熟度密切相关。过去一年,特别是最近的3-5个月,市场发展清楚地表明OpenStack会是IaaS的最终赢家,未来企业用户在选择IaaS的时候,将不再是在不同IaaS平台之间、而是在不同厂商基于OpenStack实现的平台之间做出选择。IaaS基于OpenStack的“归一化”也是企业用户认为IaaS技术走向成熟、可以放心部署的一个重要因素。有些更激进的想法甚至认为,因为归一于OpenStack,对厂商来说企业IaaS很快将变成食之无味的Commodity市场。
相反,PaaS无论在客户需求还是技术发展方向等方面都不清晰,相信未来一两年内客户大规模部署的可能性不大。
观点3:数据中心云平台与SDN之间的整合基于VxLAN
过去两年的发展说明,不同场景(如数据中心内部、广域互联等)需要利用SDN解决的问题完全不一样,而采用的技术也就完全不同。数据中心内部关注点在虚拟资源之间的有效整合,从我们接触的客户和项目来看,以VxLAN的发展前景最为看好,而NvGRE的前景则并不乐观,在所有我们接触的项目里几乎无一例外地要求支持VxLAN,而在为数不多的要求支持NvGRE的项目里,也只是为了要求厂商保证以后发展的需要,而并无当前业务的真正需求。另外,考虑到VMware/NSX在企业市场的地位,支持VMware/NSX和OpenStack/VxLAN已经是所有数据中心SDN网络的基本要求。
但必须注意的是,基于VxLAN来整合云平台与SDN网络从方向上虽然越来越清晰,但具体到真正成熟稳定的部署则尚有一段不短的距离,这有VxLAN技术尚待完善的原因,也和不同客户、不同厂商在实现VxLAN时,其硬软件部件无论从功能、组网方式、实现方法、以致性能容量等设计和参数都有不同的选择有关。所以异构厂商云平台和SDN网络互联互通会一直是个困扰,期待短时间内(至少1年)能完全解决并不现实。
当然这并不等于完全没办法,我们也有一些实际运行的案例。但这些互联互通案例都有如下特征:(1)客户类型。绝大部分都是ISP客户,而其中大部分都以开源开发自己的云平台而需要和数据中心网络整合,只有极少数是ISP以外的企业用户;(2)定制。一般都是基于客户需求的定制版本,而不是网络厂商的通用版本,另外客户需求都有其特殊性,运行场景并不一定适合其他客户;(3)接口。目前关注点在SDN控制器的北向接口(North Bound Interface),控制器和交换机之间的南向接口并不是重点。
这正好推翻3年前我们对SDN的其中一个判断。当年我们和业界大部分人士一样,认为随着SDN控制交换平面分离会催生网络产业链格局的大变化,市场会因为SDN分别出现专门开发SDN控制器和交换机的厂商,从而推动交换机的commodity化。过去两年的经验告诉我们,SDN在这方面的发展更像当年NGN的发展,技术上虽然控制交换平面最终解耦,用户部署时还是倾向控制器和交换机从同一厂商购买以降低技术风险,现在控制器互联互通集中在北向而不是南向接口,正好反映出与NGN当年相同的趋势,而在这种趋势之下,OpenFlow虽然还是重要的协议之一,但已不如当年认为的那么关键。
我们的看法是:除了极少数(估计全球少于10个)有能力自己开发控制器的大型网站(OTT)外,异构SDN控制器和交换机部署不会普遍,而专注SDN控制器的厂商并没有多大的生存空间。另外,我们认为随着VxLAN的进一步发展成熟,早几年很热门的大二层协议TRILL会逐渐淡出,TRILL可视作目前因为VxLAN尚未成熟而采取的一个替代方案,适用于个别应用场景(如ISP多租户网络)。
观点4:公有云/私有云平台的发展最终是分道扬镳而不是一体两面
公有云平台的特点在支撑用户/数据量大,而支撑大用户量靠的是牺牲特性、简化需求以便于技术解耦,从而反过来增加总体系统的性能和容量。相反私有云需要以同一平台分别部署在不同客户环境,同时需要满足不同用户的个性化需求,追求的是丰富的功能选项,而在某种程度上牺牲性能。那么是否可以利用同一平台同时满足个性化和超大容量需求?长远来说我们持否定态度,特别是考虑到DC 3.0的技术发展方向,这一点就更加确定。
另外,和所有大型系统一样,公有云的体量优势(Volume Advantage)需要有一定体量的部署才能体现,如果低于相关系统设计的体量拐点(Tipping Point),其性能价格比相对私有云平台可以说毫无优势可言。因此,厂商要么专注公有云,要么专注私有云,要么提供两个不同版本分别支持公有云和私有云,而不会采用同一平台、同一版本支持又公又私(除非其所提供的不是最优方案)。
基于同样的逻辑进一步推论,混合云平台的立足点既然是面向不同企业客户,无可避免需要满足功能的多样性,所以我们推断混合云平台架构以私为主,并辅以“能力”与公有云平台对接,并动态利用公有云相关服务,其工作方式有点类似网络上的网关(Gateway)。此外,我们认为私有云和公有云平台的关系,与话音网络中PBX与公网分工互补的关系相类似。又由于云计算的个性化要求远高于话音通信,相信之后技术发展分道扬镳会更明显。同理,我们认为私有云在整个云计算的占比会比PBX在整个话音网的占比为高。
必须说明的是,关于公有云、私有云应该是单一还是不同平台?在我们内部也有不同看法,这只好由时间来证明到底谁对谁错。
观点5:企业应用“云化”过程中技术上采用渐进型路向
此观点其实是上一个观点从“平台”推演至“应用”的进一步延伸。我们认为企业的云化历程和互联网企业完全不一样。互联网企业(如谷歌)采取的是革新模式(Revolution Model),他们一方面没有传统行业的利旧问题需要考虑,另一方面需要一个全新模式以支撑其面向超大型用户群的新型业务,其中分布式架构、应用/技术深度解藕和“以应用适配核心基础系统”是这种革新性系统的特色。
和互联网企业不同,一般企业用户需要考虑应用平稳过渡和利旧降低成本等因素。所以通常也是最正确的做法是按个别应用的需求来判断该应用是否有需要在技术上“互联网化”,而需要与否的核心点正在于“量”,包括用户量、数据量和交易量等各种不同维度的处理需求,以及“互联网化”是否能充分发挥其技术核心概念中分布式处理和深度解藕所带来的好处,来对应用进行匹配修改。从我们的分析和经验来看,对大部分企业用户来说,OLAP是目前唯一有可能需要考虑“互联网化”的应用,但就算OLAP,以目前大部分用户的数据量和交易量来看,也不一定需要立即“互联网化”。目前考虑“互联网化”OLAP的企业用户,基本上都是为了“将来”(研究和测试性质的项目除外)。
企业渐进模型云平台的异构化需求,有别于互联网平台的相对单一化以利用分布式解藕增加系统处理能力。企业级云平台需要支持不同维度、不同层次的异构环境,需要硬件资源的多样化并动态匹配上层应用的需求,同时提供统一资源调配管理界面。这就是互联网和一般企业在需求和解决路线上的核心分别,也就是“简化”与“多样化”的分别。这也是我们在观点4里提出公有云/私有云平台的发展最终是分道扬镳而不是一体两面的理论依据。
观点6:从“Open System”向“Open Source”过渡
这方面我们没有明显的倾向,在这里只是反映市场上一些有趣的看法。20年前整个ICT行业的总体方向是从专用系统(Proprietary System)过渡到开放系统(Open System),现阶段的发展应该是从开放系统往开源系统(Open Source)过渡,而云计算是推动开源系统发展和普及的最好时机。
按我们的分析,某种程度上这种取代是以国家为单位的,个别国家希望通过云计算和开源的机会推动本土ICT产业链的发展;而对很多技术积累不够的国家来说,开源很大程度代表透明可控,也就很大程度代表信息“安全”,中国和俄罗斯是推动从开放向开源发展最为典型的例子;有趣的是,也有个别用户认为开源本身反而是不安全的因素,因而否定开源,估计这和每个国家、每个企业之前的软件积累有关。