数字储能网 -智能算力、数据中心与基站 - PowerX白皮书拆解：AIDC忙起来，单靠拦截流量根本没用 }

当前位置：首页 >双碳目标>智能算力、数据中心与基站返回

PowerX白皮书拆解：AIDC忙起来，单靠拦截流量根本没用

作者：数字储能网新闻中心来源：PowerX 发布时间：2026-05-19

数字储能网讯：在过去，行业里一直默认一个前提：电力消耗一定是是跟算力吞吐量绑定的，想要降低功耗，唯一的办法就是等服务器闲下来。但在今天的大模型推理和训练场景里，几乎是不可能的。

传统工厂可以错峰，部分产线可以暂停，很多制造业负荷本身就具备负荷调节能力。但AI数据中心不一样。尤其是推理型集群，用户随时随地在调用，它必须24小时在线，还要维持极低延迟。这就让它成了一个极其难搞的“刚性负荷”。

而PowerX这次想做的，已经不只是“给数据中心配储能”这么简单，它真正想定义的是一种“电网原生AI（Grid-Native AI）”架构。

毫秒与秒之间

储能与算力的“接力赛”

PowerX近日发布了专为数据中心设计的机架式储能系统 “PowerX Energy Blade” 的产品概念，在其机架式储能系统白皮书中，提供了一个很有意思的架构思路。整个系统被拆成两层：底层是高功率的机架式储能（电池与逆变器）；上层是算力调制层（Compute Modulation），负责动态调整AI集群的运行状态。

这里面真正有技术含量的地方，是两者的“时间差”。电网如果出了波动，要求响应的时间是毫秒级的（比如调频服务FCR）。但算力调度软件没那么快，里面牵扯到网络路由重新定向、队列重新排、服务器状态收敛，再快也需要个几秒钟的窗口期。

▍Compute-Battery Bridge（算力-电池桥）

于是，PowerX提出了一个非常关键的机制：Compute-Battery Bridge（算力-电池桥），本质上是一套“接力机制”。当电网下达调节指令的那一瞬间，部署在机柜里的Energy Blade电池和逆变器率先在毫秒内完成响应，不管是充还是放，先把这个缺口顶上。这其实是给上层的算力调度争取了宝贵的几秒钟“缓冲时间”。

紧接着，算力调度平台（也就是白皮书里提到的 GCOP）开始接力干活，通过调整服务器的负载，平滑地把功耗拉到目标线上。这时候，控制权就从电池平稳地移交给了算力层。

这样做有个极大的好处，就是电池不需要长时间大功率死撑，因为储能只负责“瞬时桥接”，后面的持续调节交给算力系统完成。所以整个系统并不需要无限堆大电池容量，机架空间、热管理压力和整体成本都能显著下降。这个思路，已经非常接近“虚拟电厂化的数据中心”了。

正在往“机架级储能”方向演化

PowerX其实已经不满足于“外挂储能”的传统思路。从白皮书披露的架构参数来看，Energy Blade正在朝“机架级储能”方向演化。整个系统已经不是传统UPS，而是开始把储能系统直接融合进AI机架内部的供电架构。

例如其单机架支持最高125kW双向功率调节，而对应AI Rack的目标负载本身也在40-120kW区间。这意味着储能系统已经开始与GPU机架形成同等级功率耦合，而不是作为外围辅助设备存在。

更关键的是，它采用了48V DC Server Bus架构。这实际上意味着，PowerX正在尝试把储能系统直接融合进服务器直流母线层，而不是继续沿用传统 AC UPS 架构。而从<5ms的调频响应速度，以及 PJM、ENTSO-E等电网辅助服务接口来看，Energy Blade的目标也已经不只是数据中心保电，而是让AI机架本身直接参与电网动态调节。

它最重要的实验

其实推翻了很多行业认知

这篇白皮书最值得看的地方，不是概念，而是它做的那组GPU功耗实验。研发团队拿了一套8×H200 NVL的推理集群，跑Llama-3.1 70B，测出了不少颠覆认知的数据。

▍GPU的满载功耗带极窄（约24%）

实验发现，大模型一跑起来，单台服务器的整体功耗就在3629W到4500W之间。也就是说，只要服务器是活跃的，单靠减少或者拦截用户的请求流量，根本没办法大幅度把功耗拉下来。这与传统CPU型负载非常不同。AI GPU的静态功耗占比明显更高，一旦进入高活跃区间，即使“少干活”，也未必“少耗电”。

▍单一控制机制已经不够用了

必须协同使用“工具箱”里的多项微调手段。白皮书里提出了几种可行性较高的控制机制，包括：

集群整合（Fleet Consolidation）：通过快速重定向流量，把业务集中到更少GPU上运行，让空闲GPU进入低功耗状态。流量重定向可以在1秒内完成，而整体功耗稳定通常需要10~30秒。

混合精度路由（Mixed-Precision Routing）：建立多个不同精度的模型副本，根据任务需求动态切换请求路径。例如将部分请求切换到低精度模型，在不明显影响用户体验的前提下降低功耗。

单GPU功率变频限制（Per-GPU Power Cap）：直接在驱动与固件层限制GPU 最大功率，这是更深层的调节方式，可以在亚秒级生效。

这组实验最终证明了一件事：算力和功耗，是可以解耦的。通过动态调整活跃GPU数量或者切换模型精度，数据中心完全可以在不中断核心算力交付、不破坏用户体验的前提下，大范围地移动自身的整体功耗。

在未来，数据中心运营商除了赚取算力收益外，还可以通过参与电网辅助服务（如调频、需求响应）和电力套利来开辟新的收益线。并且运营商还可以向电网申请“非牢固并网协议（Flexible-load connection）”，在电力紧张、常规并网受阻的地区绕过漫长的电网升级审批，实现提前并网，抢占市场先机。

写在最后

当然，客观来看，这份白皮书目前展示的还只是早期实验数据，还没有在超大规模的商业化场景中得到全面验证。

这也是为什么，越来越多能源公司开始进入AI基础设施。因为未来的数据中心，可能已经不是单纯的信息基础设施。而是新型电力系统的一部分。

分享到：

关键字：数据中心

数字储能网版权说明：

1、凡注明来源为“数字储能网：xxx（署名）”，除与数字储能网签署内容授权协议的网站外，未经本网授权，任何单位及个人不得转载、摘编或以其它方式使用上述作品。

2、凡本网注明“来源：xxx（非数字储能网）”的作品，均转载与其他媒体，目的在于传播更多信息，但并不代表数字储能网赞同其观点、立场或证实其描述。其他媒体如需转载，请与稿件来源方联系，如产生任何版权问题与本网无关。

3、如因作品内容、版权以及引用的图片（或配图）内容仅供参考，如有涉及版权问题，可联系我们直接删除处理。请在30日内进行。

4、有关作品版权事宜请联系：13661266197、邮箱：ly83518@126.com