为AI处理器集群供电-600学习网

600学习网终身会员188,所有资源无秘无压缩-购买会员

最近,基于AI ASIC处理器的新型集群超级计算机的引入将电力传输网络的边界提升到了几年前从未想象过的水平。随着电流水平接近100kA/ASIC集群的应用,有必要在电力系统架构.拓扑.控制系统和封装方面进行创新,以满足如此高的电流需求。由于功率水平的不断提高,使用48V电源母线进行电力传输非常重要。此外,处理器集群日益紧凑的应用限制了在处理器旁边水平放置电源方案的可行姓,因此需要一种新的电源方案来解决这个问题。

Victor 48V直接到负载(<1V)比例架构(FPA™) 与常见的48V中间总线架构(IBA)不同,IBA传统上由中间总线转换器和多相PoL调节器组成。FPA通过创新的解决方案独特地解决了集群处理器系统面临的每一个电力传输问题。它还支持在处理器的相应表面上垂直放置电源解决方案。这种垂直电源传输(VPD)对于向此类群集系统提供高电流至关重要。

集群电力传输的挑战

集群ASIC系统被紧密封装,以实现所需的高速带宽,从而实现AI训练工作量(如自动驾驶)所需的数万亿处理性能。集群中的每个处理器本身可能需要600到1000安培的电流。因此,即使在单处理器加速器卡上,如果电源方案的位置不靠近处理器的电源引脚,也会导致严重的PCB或基板阻抗损失,从而对电源传输造成功耗挑战。

此外,GPU和专用AI处理器已采用7nm和5nm工艺,3nm硅工艺节点即将投入使用,从而实现人工智能(AI)的快速发展。这些过程节点的标称核心工作电压目前在0.75和0.85V之间。为了实现AI所需的工作性能,需要先将GPU和处理器放置在加速卡上,然后将加速卡群集到基于服务器机架的系统。数据中心和高性能计算机的每个机架中都有4或8个加速卡。然而,最近来自大脑和特斯拉的介绍展示了另一种将人工智能ASIC本身聚类的方法。这种方法可以产生具有巨大计算能力和高功率密度的超级计算机,但它也给电力传输和热管理/冷却带来了严峻挑战。

对于电力传输,ASIC/GPU集群没有像单处理器或双处理器AI卡那样的水平电力传输空间,ASIC/GPU集群使用的高速I/O信号对高电流开关噪声(即硬开关多相降压稳压器工作时产生的噪声)极为敏感。因此,将硬开关多相电源方案移近处理器将带来更多的电流切换噪声。在这种情况下,电源方案设计不仅必须满足对噪声敏感的I/O信号的要求,还必须尽可能降低PDN值,这是一个巨大的挑战。在40–60A/相的典型设计值下,为每个AI ASIC或GPU(在许多情况下,每个AISC的电流需求大于1500A)提供峰值电流所需的多相电源方案的数量很容易超过30相。在这种应用场景中,传统的水平电源(多相降压方案)几乎不可能实现。

一种新的比例电源解锁电流传输方法

分数架构(FPA)的基本原理是将功率转换器划分为两个主要功能,分别优化每个功能,然后将这些功能作为一个系统来实现。这两个功能是电压稳定和电流倍增。

电压稳定

调节器的效率与所做的功成反比-功越多,效率越低。调节器的输入电压和输出电压越接近,所做的工作越少,效率越高。通过优化分数结构在系统中的位置,可以最小化调节器的输入输出电压差。公共关系管理™ 该稳压器采用零电压开关(ZVS)降压-升压拓扑,在输入电压和输出电压之差很小时具有高效率。ZVS大大降低了开关损耗,实现了高频操作,并大大减小了转换器的尺寸。公共关系管理

为了实现这些功能,Victor VPD解决方案是由三层组成的集成模块:下层是齿轮箱,中间层是VTM™ 当前乘法器阵列,上层为PRM™ 电压调节器,这三层构成了一个完整的VPD解决方案,我们称之为DCM™。 齿轮箱执行两个功能:一个是包含高频去耦电容器,另一个是重新分配VTM的电流,以形成与上述处理器图像一致的模式。VTM阵列的大小取决于处理器的输入电流要求,而PRM的大小则取决于总功率要求。如果GPU或ASIC需要多个电源轨,则可以分别使用独立的PRM和VTM来实现VTM层和PRM层,并且它们的大小可以满足每个特定轨的电流和电压要求。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

图3:Victor DCM™ 这是一个完整的48V加载VPD解决方案,用于在高级封装中实现的ASIC集群。公共关系管理™. VTM公司™ 和模块的齿轮箱层提供电压稳定.电流倍增.去耦电容和引脚对引脚封装匹配。

维柯FPA™ 架构.ZVS和ZCS控制系统.高频SAC™ 电流倍增器拓扑与芯片™ 封装技术提供了改进VPD的所有要素。它解决了低噪声.集群式电力传输的问题,并通过封装高效.热适应姓强的电源模块简化了冷却和热管理的机械设计。VPD解决方案允许处理器通过集群分析高速和海量数据,从而改进训练模型,并将机器学习提升到更高的水平,从而成为高性能AI系统的真正驱动力。

获得高性能计算能力的更好方法

人工智能和机器学习正处于发展的初级阶段,这列火车只会随着时间的推移而加速。这种加速需要更快地处理更复杂数据的解决方案。基于AI ASIC处理器的新一代超级计算机将需要比传统超级计算机更多的功率。新的创新动力传输方案是AI实现其承诺的唯一途径。它要求电力系统架构.拓扑结构.控制系统和封装协同工作,以满足不断增长的大电流需求。使用电流倍增器的垂直电源方案是首选解决方案。这是一个经过验证且成熟的解决方案,可以满足当今对高性能计算的需求,并且可以轻松扩展以跟上未来的需求。它结构紧凑,效率高,可将PDN功率损耗降低50%以上。

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 为AI处理器集群供电-600学习网