数字储能网欢迎您!
当前位置: 首页 >双碳目标>智能算力、数据中心与基站 返回

PowerX白皮书拆解:AIDC忙起来,单靠拦截流量根本没用

作者:数字储能网新闻中心 来源:PowerX 发布时间:2026-05-19 浏览:

数字储能网讯:在过去,行业里一直默认一个前提:电力消耗一定是是跟算力吞吐量绑定的,想要降低功耗,唯一的办法就是等服务器闲下来。但在今天的大模型推理和训练场景里,几乎是不可能的。

传统工厂可以错峰,部分产线可以暂停,很多制造业负荷本身就具备负荷调节能力。但AI数据中心不一样。尤其是推理型集群,用户随时随地在调用,它必须24小时在线,还要维持极低延迟。这就让它成了一个极其难搞的“刚性负荷”。

而PowerX这次想做的,已经不只是“给数据中心配储能”这么简单,它真正想定义的是一种“电网原生AI(Grid-Native AI)”架构。


01

毫秒与秒之间

储能与算力的“接力赛”

PowerX近日发布了专为数据中心设计的机架式储能系统 “PowerX Energy Blade” 的产品概念,在其机架式储能系统白皮书中,提供了一个很有意思的架构思路。整个系统被拆成两层:底层是高功率的机架式储能(电池与逆变器);上层是算力调制层(Compute Modulation),负责动态调整AI集群的运行状态。

这里面真正有技术含量的地方,是两者的“时间差”。电网如果出了波动,要求响应的时间是毫秒级的(比如调频服务FCR)。但算力调度软件没那么快,里面牵扯到网络路由重新定向、队列重新排、服务器状态收敛,再快也需要个几秒钟的窗口期。

▍Compute-Battery Bridge(算力-电池桥)

于是,PowerX提出了一个非常关键的机制:Compute-Battery Bridge(算力-电池桥),本质上是一套“接力机制”。当电网下达调节指令的那一瞬间,部署在机柜里的Energy Blade电池和逆变器率先在毫秒内完成响应,不管是充还是放,先把这个缺口顶上。这其实是给上层的算力调度争取了宝贵的几秒钟“缓冲时间”。

紧接着,算力调度平台(也就是白皮书里提到的 GCOP)开始接力干活,通过调整服务器的负载,平滑地把功耗拉到目标线上。这时候,控制权就从电池平稳地移交给了算力层。

这样做有个极大的好处,就是电池不需要长时间大功率死撑,因为储能只负责“瞬时桥接”,后面的持续调节交给算力系统完成。所以整个系统并不需要无限堆大电池容量,机架空间、热管理压力和整体成本都能显著下降。这个思路,已经非常接近“虚拟电厂化的数据中心”了。


02

正在往“机架级储能”方向演化

PowerX其实已经不满足于“外挂储能”的传统思路。从白皮书披露的架构参数来看,Energy Blade正在朝“机架级储能”方向演化。整个系统已经不是传统UPS,而是开始把储能系统直接融合进AI机架内部的供电架构。

例如其单机架支持最高125kW双向功率调节,而对应AI Rack的目标负载本身也在40-120kW区间。这意味着储能系统已经开始与GPU机架形成同等级功率耦合,而不是作为外围辅助设备存在。

更关键的是,它采用了48V DC Server Bus架构。这实际上意味着,PowerX正在尝试把储能系统直接融合进服务器直流母线层,而不是继续沿用传统 AC UPS 架构。而从<5ms的调频响应速度,以及 PJM、ENTSO-E等电网辅助服务接口来看,Energy Blade的目标也已经不只是数据中心保电,而是让AI机架本身直接参与电网动态调节。


03

它最重要的实验

其实推翻了很多行业认知

这篇白皮书最值得看的地方,不是概念,而是它做的那组GPU功耗实验。研发团队拿了一套8×H200 NVL的推理集群,跑Llama-3.1 70B,测出了不少颠覆认知的数据。


▍GPU的满载功耗带极窄(约24%)

实验发现,大模型一跑起来,单台服务器的整体功耗就在3629W到4500W之间。也就是说,只要服务器是活跃的,单靠减少或者拦截用户的请求流量,根本没办法大幅度把功耗拉下来。这与传统CPU型负载非常不同。AI GPU的静态功耗占比明显更高,一旦进入高活跃区间,即使“少干活”,也未必“少耗电”。


▍单一控制机制已经不够用了

必须协同使用“工具箱”里的多项微调手段。白皮书里提出了几种可行性较高的控制机制,包括:

集群整合(Fleet Consolidation): 通过快速重定向流量,把业务集中到更少GPU上运行,让空闲GPU进入低功耗状态。流量重定向可以在1秒内完成,而整体功耗稳定通常需要10~30秒。

混合精度路由(Mixed-Precision Routing):建立多个不同精度的模型副本,根据任务需求动态切换请求路径。例如将部分请求切换到低精度模型,在不明显影响用户体验的前提下降低功耗。

单GPU功率变频限制(Per-GPU Power Cap): 直接在驱动与固件层限制GPU 最大功率,这是更深层的调节方式,可以在亚秒级生效。


这组实验最终证明了一件事:算力和功耗,是可以解耦的。通过动态调整活跃GPU数量或者切换模型精度,数据中心完全可以在不中断核心算力交付、不破坏用户体验的前提下,大范围地移动自身的整体功耗。

在未来,数据中心运营商除了赚取算力收益外,还可以通过参与电网辅助服务(如调频、需求响应)和电力套利来开辟新的收益线。并且运营商还可以向电网申请“非牢固并网协议(Flexible-load connection)”,在电力紧张、常规并网受阻的地区绕过漫长的电网升级审批,实现提前并网,抢占市场先机。

04

写在最后

当然,客观来看,这份白皮书目前展示的还只是早期实验数据,还没有在超大规模的商业化场景中得到全面验证。

这也是为什么,越来越多能源公司开始进入AI基础设施。因为未来的数据中心,可能已经不是单纯的信息基础设施。而是新型电力系统的一部分。

分享到:

关键字:数据中心

数字储能网版权说明:

1、凡注明来源为“数字储能网:xxx(署名)”,除与数字储能网签署内容授权协议的网站外,未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品。

2、凡本网注明“来源:xxx(非数字储能网)”的作品,均转载与其他媒体,目的在于传播更多信息,但并不代表数字储能网赞同其观点、立场或证实其描述。其他媒体如需转载,请与稿件来源方联系,如产生任何版权问题与本网无关。

3、如因作品内容、版权以及引用的图片(或配图)内容仅供参考,如有涉及版权问题,可联系我们直接删除处理。请在30日内进行。

4、有关作品版权事宜请联系:13661266197、 邮箱:ly83518@126.com