阿里巴巴技术架构首次曝光 | 站在双11的肩膀上看阿里云企业级互联网架构

jopen 9年前

2015天猫双11全球狂欢节以912.17亿元的答卷完美收官。

双11当天14万笔/秒的交易创建峰值和8.6万笔/秒的支付峰值双双刷新了世界纪录,相比首届双11,订单创建峰值增长了350倍,支付峰值增长了430倍。

天量数字的背后,是中国计算能力的登顶全球。

阿里云计算总裁胡晓明表示,阿里巴巴承载双11的计算能力和技术正在通过阿里云加速向外输出,通过标准化的产品和服务,完全可以搭建一个像淘宝、天猫这样的万亿级企业应用,满足任何极端的业务挑战。

近日,阿里云资深技术专家沈询向外详细披露了阿里云企业级互联网架构,正是这套被称为“双11背后男人”的架构体系,撑起了912亿的天量交易,这套系统也正被中国石化等大型企业视为互联网转型的基石。

阿里巴巴技术架构全方位曝光

每年的双11,天猫、淘宝都有很多新玩法,要保证新玩法快速响应,又要保证大促期间系统稳定,阿里云到底是用什么技术架构来支撑多样化的业务呢? 

沈询表示,阿里的系统自上而下分为5个层面,分别是业务逻辑展现层、业务能力运营层、云化业务能力层、企业级互联网架构能力层和阿里云基础设施。

阿里巴巴技术架构首次曝光 | 站在双11的肩膀上看阿里云企业级互联网架构  

其中最为关键的是云化业务能力层的积累。

例如,淘宝内有类似商品,交易,评价这样的共享能力中心,当新应用中有类似业务时都会使用这些能力中心来完成新功能,而每个能力中心都由专门的开发团队来负责。

“让专业的团队做专业的事”,团队的协调成本可以有效控制,开发效率得到了显著地提升。

这些业务能力的积累也逐渐成为了阿里最重要的竞争力,发展新业务时,只需在既有存量能力的基础上,开发增量部分就可以完成业务,节省了大量开发资源。

五年,10万+服务化接口

在过去的五年时间里,阿里内部的所有系统已经全部完成了服务化改造,并且通过能力开放平台对外提供统一的接口服务。

目前,整个阿里巴巴的业务能力平台已经积累了千个应用,提供了十几万个服务化接口。

沈询指出,阿里与其他企业最大的不同在于其底层平台的技术支撑。

在创业之初,阿里也选择了购买成熟的企业级应用技术来解决架构问题。然而在实践中,阿里很快就发现传统架构在面对互联网应用时明显力不从心。

阿里巴巴技术架构首次曝光 | 站在双11的肩膀上看阿里云企业级互联网架构

因此,针对快速开发、海量用户、大量数据、低延迟等互联网应用的实际需要,阿里云分别开发了企业级分布式应用服务框架EDAS分布式数据库服务DRDS消息队列Message Queue等来应对复杂的业务应用。

经过多年积累,如今这个架构已经非常成熟,并在历年的双11时期经受住了考验。 

阿里云企业级架构的核心价值

互联网时代,企业的核心就是效率。

沈询表示,阿里云企业级互联网架构为用户提供的最核心价值,在于随着系统机器数量的不断增加,处理性能呈线性上升,可靠性呈指数级上升,而运营成本不会随着机器的增加而显著增加。

为了实现这个价值,阿里云企业级互联网架构呈现了去服务化、中心化、异步化、高可用、数据化运营等五大特征。 

具体来说,服务化的技术体系提供企业级分布式应用框架EDAS来实现原有业务面向互联网服务化改造,改变企业内竖井式、烟囱式的系统建设,让应用开发周期更短,并且能够让IT应用系统进一步的促进业务发展。

同时,阿里云采用了去中心化架构,没有核心流量汇入点,这样带来的负载更小,故障影响的范围也更小。

阿里巴巴技术架构首次曝光 | 站在双11的肩膀上看阿里云企业级互联网架构

然而,去中心化也会面对系统运维和管理成本的上升的问题。

阿里云经过数千个应用近10年的不断锤炼和试错,已经从一个个充满血泪的运营故障中积累了一套数据化、自动化运维的经验,能够大幅降低去中心化应用系统的运营成本。

沈询表示,在大量的实践中,只有很少的部分业务流程需要使用到强一致的方案。 

在大部分场景中,阿里云都可以依托消息队列Message Queue,通过异步化、最终一致的方案来完成业务逻辑。

以双11为例,完成一次交易动作需要调用200多个应用系统同时完成,假设每个系统需要10毫秒才能返回,那么整条链路就需要2秒钟才能完成调用过程,再结合前端延迟,总时长或超3秒。

数据显示,每增加1秒延迟,就会有流失6%的用户。而异步化系统能有效改善该现象,只要保证三个应用的同步调用保证,其他非重要的系统可并行在后端异步完成,最后用户体感的延迟将从原有的2秒直接下降到30ms,用户流失率将大幅降低。

在云计算环境下,阿里云使用了成千上万个虚拟机来负载业务,并对自动化提出了更高的要求。

阿里云研发的,分布式数据库服务DRDS消息队列MessageQueue都能以自动化的形式实现系统的秒级切换和快速恢复,对应用几乎没有影响。

大数据时代离不开数据化运营,除了上述几点,阿里云企业级互联网架构的服务层都具备了成熟的数据化运营体系,能够帮助用户精准定位目前系统中存在的问题,并提出相应的改善方案。

上述五大特征,铸就了阿里云企业级互联网应用架构平台,沈询表示,该架构已经基本成为了企业内各类业务的标配。

除了多年来在天猫、淘宝上的出色表现,P2P领域的红岭创投,CRM领域的网聚宝以及大型国有企业中国石化等,都借助阿里云企业级互联网架构,轻松实现了完全去中心化和异步化,在控制成本的情况下实现性能和可用性的线性提升。

每一年双11都是消费者的狂欢,同时也是一场技术盛宴。

沈询表示,阿里云正逐步对外开放架构,越来越多的大型企业正在加入到互联网转型的队伍中来,轻松拥抱云服务,构建像淘宝这样的大型分布式应用服务,快速实现业务创新、资源效率最大化。

来源:阿里云