记者 |
作为“东数西算”的代表性城市之一,乌兰察布又多了小鹏汽车这位“新朋友”。
近日,小鹏汽车宣布在内蒙古乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。
“智算”指的是智能计算,是一种专用于机器学习的算力形式。据工信部统计,目前中国已有20多座智算中心,包括谷歌、微软、Meta、特斯拉、阿里在内的科技公司都已建造智算中心。而对于自动驾驶行业来说,数据训练至关重要,算力的挑战也在加剧。
成本和效率或是此次合作中强调的关键词。
小鹏汽车董事长、CEO何小鹏向媒体表示,随着自动驾驶模拟训练的需求变化,他们需要一个强大的本地+云端的算力以支持训练。“去年初我们就判断,2025年之后小鹏的算力每年花费可能会超过10个亿,因此要思考如何把算力不断提高,控制好成本,把技术铺垫做好。”何小鹏说。
据小鹏汽车方面介绍,“扶摇”对GPU资源进行细粒度切分、调度,将GPU资源虚拟化利用率提高3倍,支持更多人同时在线开发,效率提升十倍以上。此外,“扶摇”采用风冷、AI调温、模块化设计等绿色技术,年平均PUE(数据中心能耗电力电源使用效率)低于1.2——目前国内企业数据中心的PUE平均值为1.5左右。
之所以实现上述效果,不得不提到乌兰察布的地理和气候优势。
乌兰察布的冷凉气候可以极大地降低制冷消耗的电力,而这部分电力在大数据中心服务器电力消耗中占据较大比重,多达40%。同时,乌兰察布市数据中心可享受0.26元/度的电价,几乎是全国最优惠。除了阿里巴巴,苹果、华为、腾讯等12大数据中心都已落户乌兰察布。
从最直观的效果来看,“扶摇”建成后,自动驾驶模型训练的速度将大幅提升。以小鹏的一个核心模型为例,过去需要7天才能完成一次训练,但算力规模达600PFLOPS(每秒浮点运算60亿亿次)的“扶摇”可让训练时间缩短至不到1小时,提速了近170倍。据了解,目前“扶摇”正用于小鹏城市NGP辅助驾驶系统的算法模型训练。
尽管阿里云此前已在乌兰察布建立数据中心,但此次和小鹏汽车合建的“扶摇”采用公有云专属集群模式,是两家公司在汽车领域的首次应用尝试。
阿里云智能解决方案销售部总经理霍嘉称,之所以选择这样的模式,一方面是出于小鹏汽车对算力的优化要求,另一方面也是为了保留未来利用云计算大基础设施的弹性。
何小鹏则表示,小鹏汽车在“扶摇”中建立了三套数据闭环,跟原来的纯算力平台相比,智算中心的耦合更深。并且,除了算力、电力、存储力这些平台上的技术,双方还在软件层面进行更多合作。
霍嘉透露称,阿里云和小鹏汽车的确是基于计算存储网络开始合作,但从去年下半年开始,他们已经在人工智能平台、数字工厂等领域推进合作;“扶摇”项目也是从2021年开始推进。
今年2月17日,国家发改委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。乘着“东数西算”的东风,云计算公司将更多目光投注到西部地区。
阿里云从2020年就开始和乌兰察布合作,计划在当地投资100个亿。在和小鹏汽车合作之后,阿里云打造行业标杆案例的意图也很明显。但在建成基础设施之后,数据中心的上架率和使用率将是影响后续发展的重要因素。如何吸引更多企业和行业进行“西算”,为他们提供合适的云服务方案,是头部云计算公司共同面临的挑战。