【影像】迎战双十一 阿里巴巴工程师的“实战演习”

为了保证系统的稳定,在双十一正式开始之前,每一年阿里巴巴的技术团队都会预先进行若干次“实战演习”,以检测系统是否能够承受双十一的压力。为了保证不影响白天购物高峰期用户的正常使用,每一次压测都会选择在大家已经入睡的凌晨进行。200多名参与双十一核心系统的工程师陆续来到位于阿里巴巴杭州总部的技术作战室。他们中既有负责主交易链路的工程师,也有支付、物流、底层系统等环节的技术人员。

1. 下周就到了一年一度全民“剁手”狂欢的2017年天猫双十一,每一年的双十一对于阿里巴巴的工程师来说,也是一年一次的“大考”。

图片来源:东方ic

2. 大考之前,阿里巴巴邀请了包括海关总署在内的500多家外部合作伙伴一起进行了全链路压力测试,银行、企业、物流公司、政府职能机构等共同参与的“模拟考”也预示着双11的大幕已经徐徐拉开。

图片来源:东方ic

3. 为了保证系统的稳定,在双十一正式开始之前,每一年阿里巴巴的技术团队都会预先进行若干次“实战演习”——全链路压力测试,以检测系统是否能够承受双十一的压力。

图片来源:东方ic

4. 为了保证不影响白天购物高峰期用户的正常使用,每一次压测都会选择在大家已经入睡的凌晨进行。

图片来源:东方ic

5. 10月20日晚上11点,200多名参与双十一核心系统的工程师陆续来到位于阿里巴巴杭州总部的技术作战室。他们中既有负责主交易链路的工程师,也有支付、物流、底层系统等环节的技术人员。

图片来源:东方ic

6. 与想象中“备战”的气氛不同,深夜还在工作的工程师们并没有表现出紧张的情绪。

图片来源:东方ic

7. 天猫双十一技术大队长霜波说:“今年双十一,我们实现了全面机器智能。很多环节的工作会由机器来进行决策,减轻我们的工作压力。”随着压测的进行,屏幕上的数据出现了明显的上升,在突破某一个峰值后,曲线出现了一次小幅度的下跌,几分钟后又恢复了平稳。“刚才我们的一台机器就出现了过载的情况,分配到这台服务器的订单都出现了交易失败的情况。如果你去年在这里,就能听到有人说,要把这台机器下线,但是今年你会发现这个过程是自动的,系统自动发现了这台服务器的问题,自动的把它下线了,修复问题之后也会自动的把这台服务器重新上线。”

图片来源:东方ic

8. 霜波介绍,像这样的人工决策点,今年有一半的决策都交给了机器,压测的次数也从8次减少到了3次,“工程师的工作量减少了30%,轻松很多。”

图片来源:东方ic

9. 阿里巴巴为参加压力测试的员工提供餐饮服务。

图片来源:东方ic

10. 阿里巴巴在一间空房间内放置了若干张小床,工作累了的工程师就地和衣而睡。

图片来源:东方ic

分享 评论 (1)
更多图片报道