智算中心论文专站

AIDC Research Papers

Liquid Cooling AI Data Center Power & Thermal Systems
Current Issue

Volume 2026 · Issue 06-09

按期刊卷期页方式整理本期论文。每条仅使用日报已列出的可追溯公开来源,不新增未经核验事实。

Research Article芯片与算力

Space-CIM: Enabling Compute-In-Memory Accelerators for Thermally-Constrained Space Platforms

Sohan Salahuddin Mugdho、Md. Shahedul Hasan、Cheng Wang

Published 2026-06-04 · arXiv · Credibility S

人工智能计算需求激增推动数据中心建设,引发能源与可持续性危机。太空轨道数据中心因太阳能丰富和发射成本下降成为潜在方案,但真空环境仅依赖辐射冷却,需要大面积散热器,对标准液冷/风冷计算机部署构成热管理挑战。本文研究太空热约束对配备高带宽内存的GPU及新兴存算一体加速器的影响,提出散热器闭环协同设计方法,直接关联热约束与加速器架构。

Abstract, interpretation and reference

Abstract

人工智能计算需求激增推动数据中心建设,引发能源与可持续性危机。太空轨道数据中心因太阳能丰富和发射成本下降成为潜在方案,但真空环境仅依赖辐射冷却,需要大面积散热器,对标准液冷/风冷计算机部署构成热管理挑战。本文研究太空热约束对配备高带宽内存的GPU及新兴存算一体加速器的影响,提出散热器闭环协同设计方法,直接关联热约束与加速器架构。

中文解读

研究问题:太空平台热约束如何限制AI计算设备部署。方法线索:针对GPU与存算一体加速器,构建散热器闭环协同设计流程。意义:为AI数据中心向太空扩展提供热管理思路,探索算力与能源新边界。核验边界:仅基于给定摘要,未涉及具体实验结果、性能数据或机构结论,需核对原文完整方法细节。

参考文献

Sohan Salahuddin Mugdho, Md. Shahedul Hasan, Cheng Wang. Space-CIM: Enabling Compute-In-Memory Accelerators for Thermally-Constrained Space Platforms[J/OL]. (2026-06-04)[2026-06-09]. http://arxiv.org/abs/2606.05741v1.

Full text
芯片与算力 论文图示
Research Article算电协同

Peer-to-Peer Cloud Service Market for Data Centers Oriented to Computation-Electricity Coordination

Yugui Liu、Yibo Ding、Xudong Li、Jing Qu、Wenyi Zhang、Tong Qian、Wuyou Xiao、Zhengyang Hu

Published 2026-06-03 · arXiv · Credibility S

能源密集型数据中心已成为现代电力系统的重要灵活负载,亟需计算与电力协同。现有研究忽视地理分布式数据中心间计算资源共享的协作潜力。本文提出双层计算-电力协同框架,构建面向地理分布式数据中心的点对点云服务市场,支持双边交易以利用区域异质性;将节点边际电价嵌入框架以反映网络拥堵与价格差异。

Abstract, interpretation and reference

Abstract

能源密集型数据中心已成为现代电力系统的重要灵活负载,亟需计算与电力协同。现有研究忽视地理分布式数据中心间计算资源共享的协作潜力。本文提出双层计算-电力协同框架,构建面向地理分布式数据中心的点对点云服务市场,支持双边交易以利用区域异质性;将节点边际电价嵌入框架以反映网络拥堵与价格差异。

中文解读

研究问题:如何通过数据中心间资源共享实现计算与电力双向互动。方法线索:提出点对点云服务市场并嵌入节点边际电价。意义:提升AI数据中心在电网中的灵活性,促进算电协同。核验边界:仅依据摘要描述,未添加具体市场机制或实验结果,需核验原文完整框架。

参考文献

Yugui Liu, Yibo Ding, Xudong Li, 等. Peer-to-Peer Cloud Service Market for Data Centers Oriented to Computation-Electricity Coordination[J/OL]. (2026-06-03)[2026-06-09]. http://arxiv.org/abs/2606.04981v1.

Full text
算电协同 论文图示
Research Article热管理与液冷

Maximizing Compute Capacity in AI Data Centers through Cooling, Energy Storage, and Computing Adaptation

Shaolei Ren、Mohammad A. Islam、Adam Wierman

Published 2026-05-30 · arXiv · Credibility S

人工智能部署受站点级电力容量限制,需同时支持计算与冷却系统。非蒸发冷却系统在夏季环境温度升高时功耗大幅增加,导致每日多小时高冷却功率期。本文提出在有限站点电力预算下最大化计算容量的方法,讨论保守与激进计算系统规模选择的权衡。

Abstract, interpretation and reference

Abstract

人工智能部署受站点级电力容量限制,需同时支持计算与冷却系统。非蒸发冷却系统在夏季环境温度升高时功耗大幅增加,导致每日多小时高冷却功率期。本文提出在有限站点电力预算下最大化计算容量的方法,讨论保守与激进计算系统规模选择的权衡。

中文解读

研究问题:站点电力容量限制下如何平衡冷却与计算需求。方法线索:分析峰值与非峰值冷却功率下的规模策略。意义:为AI数据中心热管理与能效提供规划思路。核验边界:仅基于摘要,未包含具体优化算法或结果,需核验原文完整方法。

参考文献

Shaolei Ren, Mohammad A. Islam, Adam Wierman. Maximizing Compute Capacity in AI Data Centers through Cooling, Energy Storage, and Computing Adaptation[J/OL]. (2026-05-30)[2026-06-09]. http://arxiv.org/abs/2606.00457v1.

Full text
热管理与液冷 论文图示
Research Article算电协同

Grid Capacity Expansion under Data Centers and Electrified Manufacturing Large Loads

Jiyong Lee、Melody Agustin、Joanne Langsdorf、Erhan Kutanoglu、Michael Baldea、Ilias Mitrai

Published 2026-05-28 · arXiv · Credibility S

数据中心与电气化制造形成新兴大负载,本文构建多周期电网容量扩展模型,优化发电、储能与输电投资,同时考虑小时级电力调度以最小化总规划与运行成本,并提出大负载需求空间分布的新建模方法。

Abstract, interpretation and reference

Abstract

数据中心与电气化制造形成新兴大负载,本文构建多周期电网容量扩展模型,优化发电、储能与输电投资,同时考虑小时级电力调度以最小化总规划与运行成本,并提出大负载需求空间分布的新建模方法。

中文解读

研究问题:新兴大负载下电网如何进行最优容量扩展。方法线索:多周期优化模型结合小时调度与空间需求分布。意义:支持AI数据中心与电网协同规划。核验边界:仅依据摘要,未添加具体投资数值或ERCOT案例细节,需核验原文模型。

参考文献

Jiyong Lee, Melody Agustin, Joanne Langsdorf, 等. Grid Capacity Expansion under Data Centers and Electrified Manufacturing Large Loads[J/OL]. (2026-05-28)[2026-06-09]. http://arxiv.org/abs/2605.29053v2.

Full text
算电协同 论文图示
Research Article算电协同

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Denisa-Andreea Constantinescu、David Atienza

Published 2026-05-26 · arXiv · Credibility S

数据中心电力需求增速超过电网供应,系统运营商需要大灵活负载快速响应可再生能源波动。本文提出GridPilot三层预测控制器,在毫秒至小时尺度运行,并加入确定性安全岛旁路实现快速响应,针对AI超级计算机实现电网请求到GPU功率的实时转换。

Abstract, interpretation and reference

Abstract

数据中心电力需求增速超过电网供应,系统运营商需要大灵活负载快速响应可再生能源波动。本文提出GridPilot三层预测控制器,在毫秒至小时尺度运行,并加入确定性安全岛旁路实现快速响应,针对AI超级计算机实现电网请求到GPU功率的实时转换。

中文解读

研究问题:AI超级计算机如何快速响应电网调节请求。方法线索:三层预测控制结合安全岛旁路与PUE修正。意义:增强AI数据中心对电网的实时响应能力。核验边界:仅基于摘要,未包含具体响应时间或测试平台细节,需核验原文完整描述。

参考文献

Denisa-Andreea Constantinescu, David Atienza. GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers[J/OL]. (2026-05-26)[2026-06-09]. http://arxiv.org/abs/2605.26384v1.

Full text
算电协同 论文图示
Research ArticleAI 运维优化

Energy-Aware Computing in the Year 2026

Roblex Nana Tchakoute、Claude Tadonki

Published 2026-05-23 · arXiv · Credibility S

高性能计算进入Exascale时代,生成式AI应用能耗极高,成为系统瓶颈。本文综述能源感知计算,涵盖从物联网微控制器到多兆瓦数据中心的云-边-高性能计算全谱系,讨论气候变化、碳足迹与能源供应约束下的绿色计算需求。

Abstract, interpretation and reference

Abstract

高性能计算进入Exascale时代,生成式AI应用能耗极高,成为系统瓶颈。本文综述能源感知计算,涵盖从物联网微控制器到多兆瓦数据中心的云-边-高性能计算全谱系,讨论气候变化、碳足迹与能源供应约束下的绿色计算需求。

中文解读

研究问题:高性能计算与AI的能耗瓶颈及环境影响。方法线索:全谱系能源高效计算综述。意义:为AI数据中心能效与运维提供系统视角。核验边界:仅基于摘要,未添加具体贡献或预测数据,需核验原文完整综述。

参考文献

Roblex Nana Tchakoute, Claude Tadonki. Energy-Aware Computing in the Year 2026[J/OL]. (2026-05-23)[2026-06-09]. http://arxiv.org/abs/2605.24569v1.

Full text
AI 运维优化 论文图示
Research Article芯片与算力

ScaleAcross Explorer: Exploring Communication Optimization for Scale-Across AI Model Training

Minghao Li、Alicia Golden、Samuel Hsia、Michael Kuchnik、Adi Gangidi、Xu Zhang、Ashmitha Jeevaraj Shetty、Zachary DeVito

Published 2026-05-23 · arXiv · Credibility S

大规模语言模型训练需跨多个数据中心建筑与区域分配GPU资源,即“跨尺度”训练。本文基于Meta生产经验,分析并行放置、调度与网络层技术三维度设计空间,提出ScaleAcross Explorer优化器以整体优化跨尺度训练。

Abstract, interpretation and reference

Abstract

大规模语言模型训练需跨多个数据中心建筑与区域分配GPU资源,即“跨尺度”训练。本文基于Meta生产经验,分析并行放置、调度与网络层技术三维度设计空间,提出ScaleAcross Explorer优化器以整体优化跨尺度训练。

中文解读

研究问题:跨数据中心AI模型训练的通信与资源优化。方法线索:三维度设计空间表征与整体优化器。意义:支持AI数据中心算力扩展与运维。核验边界:仅基于摘要,未包含实验或模拟结果,需核验原文完整方法。

参考文献

Minghao Li, Alicia Golden, Samuel Hsia, 等. ScaleAcross Explorer: Exploring Communication Optimization for Scale-Across AI Model Training[J/OL]. (2026-05-23)[2026-06-09]. http://arxiv.org/abs/2605.24326v1.

Full text
芯片与算力 论文图示
Research Article热管理与液冷

Co-Design Optimization for Data Center Cooling System via Digital Twin

Shrenik Jadhav、Zheng Liu

Published 2026-05-15 · arXiv · Credibility S

液冷超级计算机通过多并行子环路冷却系统散热,本文提出三层优化框架,联合确定CDU在子环路的整数分配、流量分数分配,以及每时间步总流量与供水温度的协同优化,同时满足子环路热安全约束。

Abstract, interpretation and reference

Abstract

液冷超级计算机通过多并行子环路冷却系统散热,本文提出三层优化框架,联合确定CDU在子环路的整数分配、流量分数分配,以及每时间步总流量与供水温度的协同优化,同时满足子环路热安全约束。

中文解读

研究问题:大规模液冷数据中心冷却系统的最优分配与控制。方法线索:三层优化框架结合代理模型与全年运行数据。意义:提升AI数据中心液冷热管理效率。核验边界:仅基于摘要,未添加具体CDU数量或Frontier数据细节,需核验原文框架。

参考文献

Shrenik Jadhav, Zheng Liu. Co-Design Optimization for Data Center Cooling System via Digital Twin[J/OL]. (2026-05-15)[2026-06-09]. http://arxiv.org/abs/2605.15516v1.

Full text
热管理与液冷 论文图示