Copyright 2012-2025 家电库 版权所有 京ICP备20132067号-1
第二十届中国IDC产业年度大典(IDCC2025)暨数字基础设施科技展(DITExpo) 以“重塑算力 破界而生”为主题,将于2025年12月10-11日在北京首钢国际会展中心1号馆举办。欢迎报名参会,与数万算力产业从业者深入探讨产业关键领域的技术突破与商业模式创新。
立即报名!
当大模型参数从百亿跃升至万亿,算力底座的“军备竞赛”也随之进入“万卡集群”时代。从OpenAI的GPT-4,到国内“百模大战”的跟进,“万卡”已成为AI巨头入场券的代名词。然而,当我们谈论“万卡”时,如果视线仍局限于机柜功率的提升和液冷技术的引入,那可能尚未触及其变革的真正核心。
这场由AI驱动的算力变革,正从根本上重塑数据中心产业。它带来的挑战远非“更高、更快、更强”的线性迭代,而是一场关乎设计逻辑、系统架构和交付模式的“质变”。“万卡”集群,正在倒逼数据中心从“房地产”模式向“超级计算机”模式进化。
01. 建设逻辑颠覆:从“机房迁就IT”到“IT定义机房”
长久以来,传统数据中心的建设逻辑遵循一种“房东与租户”的模式。即“基建先行”,先建设一个标准化的“白色空间”(White Space),包含标准化的供配电、制冷和网络布线,然后再由不同的IT设备“拎包入住”。这种模式的优势在于通用性和灵活性,可以适配不同客户的通用计算需求。
然而,万卡AI集群的出现,彻底打破了这一延续数十年的平衡。AI集群,特别是万卡规模的GPU集群,是一个极端“挑剔”的租户。它不是由成千上万个独立的服务器组成,而是一个被设计为“单一系统”(Single System Image)的“超级计算机”。它的需求不再是标准化的机架和冷风,而是对系统架构、网络拓扑和功耗有着极端定制化、高耦合度的要求。
这就带来了一个根本性的转变:建设逻辑从“机房迁就IT”逆转为“IT定义机房”。
在万卡集群的规划中,一切都必须从IT系统本身出发。设计不再始于建筑图纸,而是始于AI集群的架构图。例如,以NVIDIA的DGX SuperPOD架构为蓝本的集群,其设计之初就已经锁定了GPU服务器的型号、InfiniBand网络交换机的布局、光纤的连接方式,乃至每个机柜高达60kW甚至100kW以上的峰值功耗。
这意味着,数据中心的土建、暖通和电气设计,从一开始就必须完全服务于这个既定的IT架构。传统M&E(机电)工程师“按经验”预留冗余和通路的做法已经失效。他们必须与IT架构师、网络工程师坐在一起,精确计算液冷管路的走向、配电单元(PDU)的精确点位,以及如何处理高密度光纤带来的物理管理噩梦。这不再是“建筑设计”,而是“系统工程”。