智算中心论文专站

AIDC Research Papers

Liquid Cooling AI Data Center Power & Thermal Systems
Current Issue

Volume 2026 · Issue 06-17

按期刊卷期页方式整理本期论文。每条仅使用日报已列出的可追溯公开来源,不新增未经核验事实。

Research Article余热回收

Data Center Life Cycle Co-Design Optimization

Shrenik Jadhav、Vidhyashree Nagaraju、Zheng Liu

Published 2026-06-14 · arXiv · Credibility S

液冷超级计算机通过并行子回路冷却系统排放数十兆瓦废热,子回路数量及冷却分配单元的分配方式在建设阶段即已固定,却缺乏针对大规模设施的系统优化。随着电网脱碳,隐含碳在设施全生命周期排放中占比上升,不必要的子回路成本难以 justify。研究提出一个框架,整合基于序列最小二乘规划的验证控制优化器所得运行能耗、物料清单的隐含碳,以及每子回路可靠性模型的预期非计划停机时间。该框架应用于Frontier超级计算机,评估将其25个冷却分配单元划分为2至6个子回路的所有611种方式。

Abstract, interpretation and reference

Abstract

液冷超级计算机通过并行子回路冷却系统排放数十兆瓦废热,子回路数量及冷却分配单元的分配方式在建设阶段即已固定,却缺乏针对大规模设施的系统优化。随着电网脱碳,隐含碳在设施全生命周期排放中占比上升,不必要的子回路成本难以 justify。研究提出一个框架,整合基于序列最小二乘规划的验证控制优化器所得运行能耗、物料清单的隐含碳,以及每子回路可靠性模型的预期非计划停机时间。该框架应用于Frontier超级计算机,评估将其25个冷却分配单元划分为2至6个子回路的所有611种方式。

中文解读

研究问题:液冷数据中心冷却子回路数量与分配在建设阶段固定,缺乏全生命周期优化。方法线索:构建整合运行能耗、隐含碳与可靠性模型的框架,对Frontier超级计算机的611种分区方案进行评估。对AI数据中心/液冷/算电协同的意义:为液冷设施在脱碳电网下的子回路设计提供量化依据,降低不必要子回路带来的碳与成本负担。核验边界:仅基于给定摘要描述的框架与应用,未包含具体最优解数值或额外实验结果,需核对原论文完整内容确认。

参考文献

Shrenik Jadhav, Vidhyashree Nagaraju, Zheng Liu. Data Center Life Cycle Co-Design Optimization[J/OL]. (2026-06-14)[2026-06-17]. http://arxiv.org/abs/2606.15408v1.

Full text 中文海报
余热回收 论文图示
Research Article算电协同

Spatial Load Correlation in AI Data-Center-Dominated Power Systems

Chandan Chaudhary、Alaaeldein Abdelkader、Yansong Pei、Mohammed Benidris、Joydeep Mitra

Published 2026-06-12 · arXiv · Credibility S

大规模数据中心的激增带来了空间相关的需求曲线,挑战了电力系统分析中负荷统计独立性的长期假设。本文研究此类负荷相关性的出现及其对数据中心主导电网的影响。解析推导表明,相关负荷波动会放大总体随机扰动,通过削弱无功功率刚度降低电压稳定裕度,并通过侵蚀自然负荷多样性效应降低频率稳定裕度。实时数字仿真研究证实,分布式数据中心的中等空间相关性会在多个母线上产生同步频率偏差和电压波动。研究结果为输电系统运营商提供了基于物理的视角,以解释新兴振荡现象并建立基于可测量负荷相关结构的稳定规划准则。

Abstract, interpretation and reference

Abstract

大规模数据中心的激增带来了空间相关的需求曲线,挑战了电力系统分析中负荷统计独立性的长期假设。本文研究此类负荷相关性的出现及其对数据中心主导电网的影响。解析推导表明,相关负荷波动会放大总体随机扰动,通过削弱无功功率刚度降低电压稳定裕度,并通过侵蚀自然负荷多样性效应降低频率稳定裕度。实时数字仿真研究证实,分布式数据中心的中等空间相关性会在多个母线上产生同步频率偏差和电压波动。研究结果为输电系统运营商提供了基于物理的视角,以解释新兴振荡现象并建立基于可测量负荷相关结构的稳定规划准则。

中文解读

研究问题:AI数据中心大规模接入后,负荷空间相关性如何打破传统独立假设并影响电网稳定性。方法线索:通过解析推导揭示相关波动对电压与频率稳定裕度的削弱作用,再以实时数字仿真验证多母线同步偏差现象。对AI数据中心/算电协同的意义:为算电协同场景下电网稳定性评估提供可量化的负荷相关结构视角,帮助运营商建立适应数据中心主导电网的规划准则。核验边界:仅基于给定摘要中的解析与仿真描述,未包含具体数值、实验平台或额外结论,需核对原论文全文确认细节。

参考文献

Chandan Chaudhary, Alaaeldein Abdelkader, Yansong Pei, 等. Spatial Load Correlation in AI Data-Center-Dominated Power Systems[J/OL]. (2026-06-12)[2026-06-17]. http://arxiv.org/abs/2606.13853v1.

Full text 中文海报
算电协同 论文图示
Research Article热管理与液冷

Maximizing Compute Capacity in AI Data Centers through Cooling, Energy Storage, and Computing Adaptation

Shaolei Ren、Mohammad A. Islam、Adam Wierman

Published 2026-05-30 · arXiv · Credibility S

人工智能部署日益受限于站点级电力容量,该容量需始终同时支持计算系统与非计算系统(主要是冷却)。冷却功率需求,尤其在非蒸发冷却系统中,会随夏季环境温度大幅增加,形成每天持续数小时的高冷却功率期。因此,在有限站点级电力预算下最大化计算容量成为重要规划与运营挑战。基于峰值冷却功率保守确定计算系统规模,会在冷却功率低于峰值时(尤其凉爽月份)造成站点级电力容量部分闲置;反之,基于低冷却功率激进确定规模,则会在夏季炎热日子里导致总站点级电力需求超过容量。本文提出Com…

Abstract, interpretation and reference

Abstract

人工智能部署日益受限于站点级电力容量,该容量需始终同时支持计算系统与非计算系统(主要是冷却)。冷却功率需求,尤其在非蒸发冷却系统中,会随夏季环境温度大幅增加,形成每天持续数小时的高冷却功率期。因此,在有限站点级电力预算下最大化计算容量成为重要规划与运营挑战。基于峰值冷却功率保守确定计算系统规模,会在冷却功率低于峰值时(尤其凉爽月份)造成站点级电力容量部分闲置;反之,基于低冷却功率激进确定规模,则会在夏季炎热日子里导致总站点级电力需求超过容量。本文提出Com…

中文解读

研究问题:站点级电力容量有限且需同时满足计算与冷却需求,冷却功率随环境温度波动导致容量利用不均。方法线索:分析非蒸发冷却系统在夏季的功率峰值特征,对比保守与激进的计算系统规模设定策略,探讨能源存储与计算自适应作为缓解手段。对AI数据中心/液冷/算电协同的意义:为热管理与液冷场景下的算电协同规划提供思路,避免电力闲置或超载。核验边界:仅依据给定摘要,方法细节与完整结论需打开论文链接核验。

参考文献

Shaolei Ren, Mohammad A. Islam, Adam Wierman. Maximizing Compute Capacity in AI Data Centers through Cooling, Energy Storage, and Computing Adaptation[J/OL]. (2026-05-30)[2026-06-17]. http://arxiv.org/abs/2606.00457v1.

Full text 中文海报
热管理与液冷 论文图示
Research Article芯片与算力

Space-CIM: Enabling Compute-In-Memory Accelerators for Thermally-Constrained Space Platforms

Sohan Salahuddin Mugdho、Md. Shahedul Hasan、Cheng Wang

Published 2026-06-04 · arXiv · Credibility S

人工智能算力需求激增推动数据中心建设,引发能源与可持续性危机。太空轨道数据中心因太阳能丰富、发射成本下降而成为潜在路径。然而真空环境仅依赖辐射冷却,需大面积散热器,热管理限制使标准液冷或风冷计算机难以部署。本文研究太空热约束对配备高带宽内存的GPU及新兴存算一体加速器的影响,提出散热器在环协同设计方法,直接关联热边界与计算架构。

Abstract, interpretation and reference

Abstract

人工智能算力需求激增推动数据中心建设,引发能源与可持续性危机。太空轨道数据中心因太阳能丰富、发射成本下降而成为潜在路径。然而真空环境仅依赖辐射冷却,需大面积散热器,热管理限制使标准液冷或风冷计算机难以部署。本文研究太空热约束对配备高带宽内存的GPU及新兴存算一体加速器的影响,提出散热器在环协同设计方法,直接关联热边界与计算架构。

中文解读

研究问题:太空平台热约束如何限制AI计算系统部署。方法线索:针对GPU-HBM与CIM加速器,构建散热器在环协同设计框架,分析辐射冷却对算力密度的影响。对AI数据中心/液冷/算电协同的意义:为缓解地面数据中心能耗危机提供太空替代思路,强调热管理与计算架构联合优化对可持续AI基础设施的必要性。核验边界:仅基于给定摘要描述,具体性能数据、实验平台与完整结论需打开论文链接核验。

参考文献

Sohan Salahuddin Mugdho, Md. Shahedul Hasan, Cheng Wang. Space-CIM: Enabling Compute-In-Memory Accelerators for Thermally-Constrained Space Platforms[J/OL]. (2026-06-04)[2026-06-17]. http://arxiv.org/abs/2606.05741v1.

Full text 中文海报
芯片与算力 论文图示
Research Article算电协同

Modal Analysis of Spatial Load Correlation in AI Data Center-Dominated Power Systems

Chandan Chaudhary、Michael Murillo、Mohammed Ben-Idris、Joydeep Mitra、Dilip Pandit、Atri Bera

Published 2026-06-12 · arXiv · Credibility S

超大规模AI数据中心引发空间和时间相关的负荷波动,违反经典独立性假设,且未被时间平均频谱方法捕捉。这些相关性呈偶发且非平稳特征,需要能解析瞬态结构的分析方法。本文将动态模态分解(DMD)应用于成对母线间相关系数的时序演化,形成低维状态表示,实现无需平稳性假设的模态分析。DMD特征值在复平面中的位置可区分持续相干、衰减瞬态与增强事件,其振荡频率映射潜在物理耦合机制。研究基于IEEE 39-bus RTDS测试平台,包含三个变流器接口AI数据中心负荷及合成工作负载剖面,全球DMD提供慢热时间平均模态基线。

Abstract, interpretation and reference

Abstract

超大规模AI数据中心引发空间和时间相关的负荷波动,违反经典独立性假设,且未被时间平均频谱方法捕捉。这些相关性呈偶发且非平稳特征,需要能解析瞬态结构的分析方法。本文将动态模态分解(DMD)应用于成对母线间相关系数的时序演化,形成低维状态表示,实现无需平稳性假设的模态分析。DMD特征值在复平面中的位置可区分持续相干、衰减瞬态与增强事件,其振荡频率映射潜在物理耦合机制。研究基于IEEE 39-bus RTDS测试平台,包含三个变流器接口AI数据中心负荷及合成工作负载剖面,全球DMD提供慢热时间平均模态基线。

中文解读

研究问题:AI数据中心负荷在空间和时间上呈现强相关波动,打破传统独立性与平稳性假设。方法线索:采用动态模态分解处理母线间相关系数的时间演化,提取低维模态并通过特征值位置与频率区分不同相关 regime。意义:为算电协同提供无需平稳假设的负荷相关分析工具,有助于数据中心与电网的动态耦合建模及运行优化。核验边界:结果基于IEEE 39-bus RTDS仿真平台与合成工作负载,实际系统验证仍需进一步核实。

参考文献

Chandan Chaudhary, Michael Murillo, Mohammed Ben-Idris, 等. Modal Analysis of Spatial Load Correlation in AI Data Center-Dominated Power Systems[J/OL]. (2026-06-12)[2026-06-17]. http://arxiv.org/abs/2606.13847v1.

Full text 中文海报
算电协同 论文图示
Research Article算电协同

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Denisa-Andreea Constantinescu、David Atienza

Published 2026-05-26 · arXiv · Credibility S

全球数据中心电力需求增速超过电网供应,系统运营商需要大型灵活负荷在秒级调整功率以吸收风光波动。对于多兆瓦AI/HPC设施,核心问题是软件栈将电网请求转化为设施电表GPU功率实际变化的速度。GridPilot提出跨毫秒、秒和小时的三层预测控制器,并配备确定性安全岛旁路以实现快速响应。在三GPU NVIDIA V100测试平台上,GridPilot实测端到端触发到目标响应为97.2 ms,比北欧快速频率储备700 ms要求快6.9倍,同时引入瞬时PUE修正以匹配调度承诺。

Abstract, interpretation and reference

Abstract

全球数据中心电力需求增速超过电网供应,系统运营商需要大型灵活负荷在秒级调整功率以吸收风光波动。对于多兆瓦AI/HPC设施,核心问题是软件栈将电网请求转化为设施电表GPU功率实际变化的速度。GridPilot提出跨毫秒、秒和小时的三层预测控制器,并配备确定性安全岛旁路以实现快速响应。在三GPU NVIDIA V100测试平台上,GridPilot实测端到端触发到目标响应为97.2 ms,比北欧快速频率储备700 ms要求快6.9倍,同时引入瞬时PUE修正以匹配调度承诺。

中文解读

研究问题:数据中心电力需求增速超过电网,如何在毫秒级将电网请求转化为GPU功率实际变化。方法线索:采用三层预测控制器覆盖毫秒、秒、小时尺度,并加入确定性安全岛旁路实现快速响应,同时集成瞬时PUE修正。意义:直接服务算电协同场景,支持AI超级计算机作为灵活负荷参与电网调节,提升响应速度与调度可靠性。核验边界:结果仅基于三GPU V100测试平台,完整多兆瓦设施验证与长期运行数据需查阅论文全文。

参考文献

Denisa-Andreea Constantinescu, David Atienza. GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers[J/OL]. (2026-05-26)[2026-06-17]. http://arxiv.org/abs/2605.26384v1.

Full text 中文海报
算电协同 论文图示
Research Article算电协同

Pushing the Frontiers for Floating Solar Photovoltaics -- The Case for South America

Soham Ghosh、Anik Goswami、Krishna Kumba

Published 2026-06-11 · arXiv · Credibility S

浮动太阳能光伏系统为能源匮乏地区提供土地高效的清洁电力途径。南美洲全球FSPV潜力最高,约每百万英亩水面38.26 TWh,但部署有限。本研究提出技术-社会-经济框架,评估FSPV对能源获取、水安全和电网灵活性的作用,以尼加拉瓜、洪都拉斯和圭亚那为案例。50至398 MW系统的年发电量超过1500至2000 kWh/kW,容量因子高于20%。在El Cajon,FSPV可显著降低化石发电排放。考虑避免土地使用、共享水电基础设施和水资源效益后,成本与陆基光伏相当。该框架强调与水电及AI数据中心共址,为欠发达地区提供…

Abstract, interpretation and reference

Abstract

浮动太阳能光伏系统为能源匮乏地区提供土地高效的清洁电力途径。南美洲全球FSPV潜力最高,约每百万英亩水面38.26 TWh,但部署有限。本研究提出技术-社会-经济框架,评估FSPV对能源获取、水安全和电网灵活性的作用,以尼加拉瓜、洪都拉斯和圭亚那为案例。50至398 MW系统的年发电量超过1500至2000 kWh/kW,容量因子高于20%。在El Cajon,FSPV可显著降低化石发电排放。考虑避免土地使用、共享水电基础设施和水资源效益后,成本与陆基光伏相当。该框架强调与水电及AI数据中心共址,为欠发达地区提供…

中文解读

研究问题聚焦南美洲浮动太阳能光伏部署有限却潜力巨大,如何通过框架实现能源、水与电网协同。方法线索采用技术-社会-经济评估,结合尼加拉瓜等三地案例,量化发电量、容量因子及成本竞争力。对AI数据中心/算电协同的意义在于提出FSPV与水电、AI数据中心共址模式,支持电网灵活性与能源获取。核验边界限于材料中给出的潜力数据、案例地点及框架描述,未涉及具体液冷技术或额外实验结果,需打开论文链接核验方法细节。

参考文献

Soham Ghosh, Anik Goswami, Krishna Kumba. Pushing the Frontiers for Floating Solar Photovoltaics -- The Case for South America[J/OL]. (2026-06-11)[2026-06-17]. http://arxiv.org/abs/2606.12798v1.

Full text 中文海报
算电协同 论文图示
Research Article算电协同

Power Grid Infrastructure for AI Data Centers

Amir Sajadi、Muhy Eddin Za'ter、Maria Vabson、Kyri Baker、Bri-Mathias Hodge

Published 2026-05-31 · arXiv · Credibility S

本文探讨人工智能近期进展引发的技术前沿竞赛,推动大规模数据中心建设。文章重点分析大型数据中心对电力电网规划与运行的影响,阐述相关基础设施应对挑战的必要性。研究基于公开文献与行业观察,总结数据中心电力需求增长对电网稳定性和扩展策略的潜在作用。

Abstract, interpretation and reference

Abstract

本文探讨人工智能近期进展引发的技术前沿竞赛,推动大规模数据中心建设。文章重点分析大型数据中心对电力电网规划与运行的影响,阐述相关基础设施应对挑战的必要性。研究基于公开文献与行业观察,总结数据中心电力需求增长对电网稳定性和扩展策略的潜在作用。

中文解读

研究问题:人工智能快速发展如何驱动大规模数据中心建设,并对电力电网规划与运行产生何种影响。方法线索:文章通过文献综述与行业观察,梳理数据中心电力需求增长对电网的影响路径。对AI数据中心/算电协同的意义:为数据中心与电网协同规划提供洞见,强调基础设施适配对算电协同的重要性。核验边界:仅基于给定标题与摘要,未包含具体方法、数据或实验结论,需查阅全文核实细节。

参考文献

Amir Sajadi, Muhy Eddin Za'ter, Maria Vabson, 等. Power Grid Infrastructure for AI Data Centers[J/OL]. (2026-05-31)[2026-06-17]. http://arxiv.org/abs/2606.00941v1.

Full text 中文海报
算电协同 论文图示