根据 Emerald 新发布的白皮书《电力柔性 AI 工厂:英国首个可响应电网调度的 AI 基础设施示范项目》(Power-Flexible AI Factories:A UK-First Demonstration of GridResponsive AI Infrastructure)[1],研究团队在英国伦敦进行了实地试验。他们在 NVIDIA Blackwell Ultra 集群上测试了 Emerald AI 的软件,该集群由 96 个高性能 GPU 组成。
这是 Emerald 通过协调 AI 工厂运行的各种不同工作负载来实现的。AI 工作负载的运行方式通常具有潜在的灵活性,某些作业可以暂停或减慢速度,例如用于学术研究的大模型的训练或微调;而另一些作业,例如为数百万用户提供的 AI 服务的推理查询,则无法重新调度,但可重定向到本地电网压力较小的其他数据中心。
Emerald Conductor 协调数据中心网络中的这些 AI 工作负载,来满足电网需求,确保对时延敏感的工作负载保持满额性能,同时在可接受范围内,动态降低非核心柔性负载的处理吞吐量。