借助电源完整性测试提高人工智能数据中心的能效

2024-07-19 来源:微波射频网 字号:

数据中心正在部署基于人工智能 (AI) 的技术,处理器密集型服务器正在推动能源需求的增长,下表说明了这种发展趋势所带来的巨大影响。国际能源署 (IEA) 预测,到 2030 年,数据中心的耗电量将占全球耗电量的 7%,相当于印度全国的耗电量。

图 1:数据中心 CPU 和 GPU 技术的功耗。

由于电力需求不断增长,关注能源效率至关重要。泰克与知名电源完整性专家 Steve Sandler 合作,开发了出色的测量技术,旨在改进下一代人工智能数据中心的运营效率/能效。

提高电源分配网络 (PDN) 的能效提高供电网络 (PDN) 的能源效率

PDN 必须为驱动服务器机架中的 GPU 敏感负载提供许多低噪声直流电源轨。追求更高速度和更高密度意味着,需要在更低电压水平和更大电流下实现更快边缘速率、更高频率和更多轨道。这突显了良好电源完整性的重要性。

进行电源完整性测试的目的是,验证到达负载点 (POL) 的电压和电流在所有预期运行条件下是否满足负载的电源轨规格要求。要在千兆赫频率下准确测量毫伏级电源轨噪声,尤其需要注意。

让我们通过基于的服务器系统的电源分配网络高能级结构图,了解如何评估 PDN 性能。

 

图 2:数据中心的高能级配电网络。

如图所示,典型数据中心通过 12 V、24 V 或 48 V 直流电源为其基于 AI 的服务器供电,然后在主板上将电压转换为其他电源电压。工程师能够查看从电源输出到 FPGA、处理器和其他复杂 IC 的链路中的每个环节,因此可以将电源轨阻抗控制在非常低的水平,以便输送由 GPU 技术驱动的 AI 服务器所需的高电流。阻抗管理的棘手之处在于配电网络由许多阻抗组成,包括电压调节器、去耦电容器和 PCB 走线。高速交换和热插拔服务器卡会引入意外的阻抗变化,这可能导致过多的瞬变或噪声。

要确保稳定节能的设计,首先要最大限度地减少 PDN 中的噪声。电源轨噪声规格可以达到数百兆赫或数千兆赫的频率范围,其幅度达到毫伏级。

评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线电压和线电流符合要求。用于评估质量的测量值如下所示:

•  频率

•  有效电压和电流

•  有效值

•  阻抗阻抗

•  波峰因数(电压和电流)波峰因数(电压和电流

•  有功功率、无功功率和视在功率真实功率、无功功率和视在功率

•  功率因数和相位功率因数和相位

为了确保准确进行这些测量,示波器探头的选择非常重要;使用差分探头测量系统的线电压,使用电流探头测量系统的线电流。

另一个关键测量是对 PDN 控制环路响应进行频率响应分析。这将提供有关控制环路速度和电源稳定性的重要信息。借助波特图查看分析结果,图 3 中是示例设置。

图 3:电源分配网络阻抗的测量设置。

电源完整性探测系统应受重视电源完整性探测系统值得关注

当今示波器配备的高阻抗 10X 无源探头可能具有足够的带宽,但会使您想要测量的噪声信号发生衰减。1X 探头可无衰减地传递噪声信号,但其带宽仅为几百兆赫。具有 50Ω 输入阻抗的传输线探头或电缆具有出色的高频性能,但在直流情况下会产生显著负载,除非增加直流隔离器。  衰减传输线探头产生的负载较小,同时保持低噪声和高带宽。

电源轨探头是另一类低噪声探头,偏移范围高达 4 GHz,直流偏移范围为 -60 至 +60 Vdc。在识别噪声源方面,电源轨探头是一种比传统无源探头更准确的替代工具,如下图 4 所示。根据电源轨的电压,可能需要直流阻断器。  如果需要,请确保直流阻断器为示波器提供浪涌保护,并且不受直流或交流偏置的影响。电源轨探头虽然能够测量很小的噪声,但也是单端测量。  因此,需要使用能够进一步减少测量接地环路误差的同轴隔离器。Picotest 提供多种直流阻断器和同轴隔离器来满足此类需求。  详细了解终极电源轨噪声测量。

图 4:使用无源探头(下方迹线)和电源轨探头(上方迹线)的电源线纹波测量比较。

快速低噪声采集与超快速边缘负载相结合,可模拟 AI 级处理器工作负载,从而可以准确评估 PDN 设计中的电源轨噪声电压以及电源轨与电源轨之间的串扰。在结合使用泰克 5 B 系列 MSO 或 6 B 系列 MSO 示波器的情况下,Picotest提供了完整的负载设备系列,最高为 2,000 安培、1 纳秒的边缘负载,并支持高达 65Ms/s 的采样率,以进行精确的模拟实验。(见图 5)快速、低噪声采集与超快边缘负载相结合,可模拟 AI 级处理器工作负载;允许准确评估 PDN 设计中的电源轨噪声电压和电源轨到电源轨串扰。与泰克 5 系列 B MSO 或 6 系列 B MSO 示波器结合使用;Picotest 提供高达 2,000 安培、1ns 边缘负载的完整负载系列,支持高达 65MS/s 的采样率,以实现精确的仿真工作。(见图5)

图 5  显示了对 AI 级处理器进行伪随机高幅度负载的特性分析。

使用 PICOTEST 负载设备进行特性分析,并通过泰克 6 系列 B MSO 示波器进行测量,可以确保特性分析的准确性。泰克 6 系列 B MSO 示波器是捕获低噪声、高分辨率信号的理想仪器。

示波器测量分析有助于节省时间并减少错误

识别和分析 PDN 中的故障点可能耗费时间。在电源分配网络中寻找纹波、过冲、欠冲、开启、关闭、时间趋势、稳定时间和抖动信号是一项复杂的任务。值得庆幸的是,当今大多数现代示波器都提供了内置分析软件,用于设置仪器和自动执行信号采集和显示。下方为波纹自动测量示例。将这些特性内置到仪器中,再加上具备通过远程 PC 进行自动化的功能,可以简化大型团队的 AI 性能评估工作,同时,还可以评估 AI 支持性能随时间和温度的变化情况,以测试服务器的效率和耐久性。

图 6:自动纹波测量,并在 5 系列 B MSO 示波器显示屏的右侧显示注释结果。

总结

由于人工智能 (AI) 推动下一代数据中心的能源需求增长,评估电源分配网络 (PDN) 的性能和效率变得比以往任何时候都更加重要。采用良好的 PDN 测试和测量策略,将会使 AI 就绪数据中心达到最佳运行性能、可靠性和能效,https://www.picotest.com/solutions/tektronix/,了解更多详情:6 系列 B MSO | Tektronix。

关于泰克科技

泰克公司总部位于美国俄勒冈州毕佛顿市,致力提供创新、精确、操作简便的测试、测量和监测解决方案,解决各种问题,释放洞察力,推动创新能力。70多年来,泰克一直走在数字时代前沿。欢迎加入我们的创新之旅,敬请登录:tek.com.cn

主题阅读:泰克