英伟达Rubin平台电源架构解析与SiC功率器件的关键赋能:迈向吉瓦级AI工厂的能源变革
倾佳电子(Changer Tech)是一家专注于功率半导体和新能源汽车连接器的分销商。主要服务于中国工业电源、电力电子设备和新能源汽车产业链。倾佳电子聚焦于新能源、交通电动化和数字化转型三大方向,代理并力推BASiC基本半导体SiC碳化硅MOSFET单管,SiC碳化硅MOSFET功率模块,SiC模块驱动板等功率半导体器件以及新能源汽车连接器。
倾佳电子杨茜致力于推动国产SiC碳化硅模块在电力电子应用中全面取代进口IGBT模块,助力电力电子行业自主可控和产业升级!
倾佳电子杨茜咬住SiC碳化硅MOSFET功率器件三个必然,勇立功率半导体器件变革潮头:
倾佳电子杨茜咬住SiC碳化硅MOSFET模块全面取代IGBT模块和IPM模块的必然趋势!
倾佳电子杨茜咬住SiC碳化硅MOSFET单管全面取代IGBT单管和大于650V的高压硅MOSFET的必然趋势!
倾佳电子杨茜咬住650V SiC碳化硅MOSFET单管全面取代SJ超结MOSFET和高压GaN 器件的必然趋势!
随着人工智能(AI)模型参数量突破万亿级别,从大语言模型(LLM)的训练向推理、以及更高级的代理型AI(Agentic AI)演进,数据中心正在经历一场从“计算集群”向“AI工厂”的根本性物理形态转变。英伟达(NVIDIA)推出的Rubin平台,作为Blackwell架构的继任者,不仅是算力密度的又一次飞跃,更是对数据中心能源基础设施的一次极限挑战。
Rubin平台的核心设计理念是“极致协同设计”(Extreme Co-design),即芯片、网络、散热与供电不再是独立的子系统,而是被视为一个紧密耦合的整体 。在这种架构下,传统的机架级功率密度(10-20kW)已显得微不足道。Rubin架构预示着单机架功率将迈向120kW甚至未来的600kW时代 。这种指数级的功率增长使得传统的48V/54V电源架构面临物理极限,迫使行业向800V高压直流(HVDC)架构转型。
在此背景下,碳化硅(SiC)作为第三代宽禁带半导体材料,凭借其耐高压、高导热、低损耗的物理特性,成为支撑这一能源变革的基石。特别是以基本半导体(BASIC Semiconductor)为代表的厂商,通过推出专为高功率密度设计的SiC模块,解决了从高压整流到固态断路保护(SSCB)的“最后一米”供电难题,确保了Rubin平台理论算力在物理世界中的安全落地。
Rubin平台不仅仅是GPU的代际更迭,它是一个由六大核心芯片组成的超级计算生命体,旨在解决大规模AI训练与推理中的通信墙、内存墙与能效墙问题。
Rubin平台集成了六款关键芯片,通过NVLink 6高速互连技术编织成一张巨大的计算网 :
:作为计算核心,Rubin GPU集成了HBM4高带宽内存,单卡容量高达288GB,旨在应对万亿参数模型的显存需求。其搭载的新一代Transformer引擎支持FP4精度,推理性能高达50 PFLOPS,是Blackwell的数倍 。
:这是一款基于Arm架构的定制CPU,拥有88个“Olympus”核心,支持空间多线程技术(Spatial Multithreading),单芯片提供176个线程。Vera CPU专为数据处理和代理型AI设计,通过C2C链路与Rubin GPU紧密协作,消除了传统x86主机CPU的性能瓶颈 。
:作为机架内的神经中枢,该交换芯片提供高达3.6 TB/s的GPU间通信带宽,使得机架内的72颗GPU能够像一颗巨型GPU一样协同工作 。
:提供1.6 Tb/s的网络带宽,确保跨机架的东西向流量不成为瓶颈 。
:作为基础设施处理器,BlueField-4卸载了网络、存储和安全任务,通过支持零信任安全架构,为多租户环境下的AI工厂提供保障 。
Rubin平台的旗舰形态是NVL72机架系统。该系统通过液冷背板和铜缆互连,将36颗Vera CPU和72颗Rubin GPU整合在一个机柜中。这种高密度的集成带来了前所未有的算力,但也带来了巨大的供电挑战。传统的NVL72基于Blackwell架构时,功耗已接近120kW 。而随着Rubin Ultra及未来Kyber架构的演进,单机架功耗预计将在2027年达到600kW,甚至向1MW迈进 。
在如此极端的功率密度下,供电网络(PDN)的效率哪怕提升0.1%,都意味着数千瓦的热量减少。因此,Rubin平台的电源架构必须经历一场从电压等级到拓扑结构的全面革命。
在传统数据中心中,电力通常经过多次转换:从电网的中压交流(MVAC)变压至480V/400V交流,再由机架内的PSU(电源供应单元)转换为48V或12V直流,最后通过母线排(Busbar)输送至服务器主板。然而,面对Rubin平台动辄数百千瓦的功耗,这种架构已难以为继。
根据焦耳定律(Ploss=I2R),传输损耗与电流的平方成正比。在低电压下传输大功率意味着巨大的电流。
:若要为一个600kW的Rubin机架供电,使用48V/54V母线安培 。
:传输如此巨大的电流需要截面积极大的铜排。据估算,支撑1MW机架的48V供电系统仅铜母线公斤,这不仅增加了机架的物理负荷,也带来了巨大的成本和布线难度 。此外,巨大的电流产生的磁场干扰和压降问题也会严重影响信号完整性和电源稳定性。
为了突破这一物理瓶颈,英伟达联合施耐德电气(Schneider Electric)、台达(Delta)、Vicor等合作伙伴,推动数据中心向800V直流供电架构转型 。
:将电压提升至800V,同样的600kW功率所需的电流降至750安培。这是一个工程上完全可控的数值,允许使用更细的线%以上的铜用量 。
:新架构采用“电源侧车”(Power Sidecar)或电网边缘整流方案,直接将13.8kV中压交流电转换为800V直流电,消除了传统机架内AC/DC PSU的转换级,从而减少了热损耗并腾出了宝贵的机架空间(RU)用于计算设备 。
:通过减少转换步骤和线V架构预计可将端到端能效提升5% 。在吉瓦级的AI工厂中,这相当于节省了数千万美元的电费。
电压的提升对功率半导体提出了严苛要求。传统的硅基MOSFET和IGBT在800V及以上的高压应用中,面临着开关损耗大、耐温性差、开关频率低等问题。这就为碳化硅(SiC)器件的大规模应用打开了窗口。SiC不仅能承受更高的电压,还能在更高的频率下开关,从而缩小被动元件(电感、电容)的体积,实现高功率密度。
SiC作为一种宽禁带半导体材料,其物理特性使其成为高压、高频、高功率密度应用的不二之选。在Rubin平台的电源架构中,SiC器件主要应用于电源供应单元(PSU)、直流-直流转换器(DC-DC)以及固态断路器(SSCB)中。
:赋予了SiC器件更高的临界击穿场强(约为Si的10倍),使其能够以更薄的漂移层承受更高的电压,从而显著降低导通电阻(RDS(on)) 。
:SiC优异的导热性使其能够更有效地将热量从芯片导出,这对于空间受限且热流密度极高的AI机架至关重要 。
:支持更快的开关速度,降低了开关损耗,使得电源转换器可以在数百kHz甚至MHz频率下运行,进而减小磁性元件体积 。
在Rubin平台的电源侧车或机架式PSU中,AC/DC转换是第一道关口。为了满足钛金级(Titanium,效率96%)甚至更高的能效标准,**无桥图腾柱PFC(Totem Pole PFC)**拓扑成为了主流选择 。
:在图腾柱PFC的“快桥臂”中,开关管需要进行高频硬开关。传统的硅MOSFET由于体二极管的反向恢复电荷(Qrr)很高,在硬开关时会产生巨大的反向恢复损耗,导致效率低下甚至器件失效。
:SiC MOSFET具有极低的Qrr,几乎可以忽略不计。这使得图腾柱PFC可以在连续导通模式(CCM)下高效运行,将效率推向99%的极限。例如,基本半导体(BASIC Semiconductor)的650V/1200V SiC MOSFET系列,正是针对此类应用进行了优化,提供了极低的开关损耗 。
在800V母线电压建立后,需要将其降压至48V或更低电压以供给GPU板卡。这一步通常采用LLC谐振变换器。
5. 固态断路器(SSCB):保障800V直流母线的安全防线V直流母线,安全保护成为一个全新的挑战。传统的机械式断路器在直流高压下存在严重的电弧问题——直流电没有过零点,电弧一旦产生极难熄灭,可能导致设备烧毁甚至火灾。此外,机械断路器的动作时间通常在毫秒级(ms),对于极其敏感且昂贵的Rubin GPU来说,这个反应速度太慢了。
固态断路器利用功率半导体器件(主要是SiC MOSFET)来代替机械触点进行电流切断。
根据基本半导体的产品资料,内部针对数据中心和SSCB应用进行了深度优化 。
:该模块的导通电阻(RDS(on))极低,仅为1.8 mΩ(1200V耐压)。在SSCB应用中,器件大部分时间处于导通状态,任何电阻都会导致持续的I2R导通损耗。1.8 mΩ的超低电阻意味着即便在数百安培的电流下,模块的自身发热也极低,从而减少了散热需求,提升了系统整体能效。
:数据中心要求7x24小时不间断运行,且负载波动剧烈(AI训练任务的突发性)。L3模块采用了高性能氮化硅(Si3N4)AMB陶瓷基板和高温焊料工艺 。Si3N4 AMB具有极高的机械强度和热导率(90 W/mK),远优于传统的氧化铝(Al2O3)DBC基板,能够承受反复的热循环冲击而不发生分层或失效 。5.2.2 动态性能实测
在双脉冲测试中,基本半导体的L3模块展现了卓越的动态特性。以单向开关模块为例,在850V母线A电流的高压大电流工况下,其开通延时(Td(on))仅为231.8ns,关断延时(Td(off))为322.4ns 。这种纳秒级的响应速度确保了当Rubin机架发生短路故障时,SSCB能在故障电流上升到破坏性水平之前将其切断,真正实现了对AI算力核心的“零损伤”保护。
除了核心的L3模块外,基本半导体的全系产品线也广泛渗透在Rubin平台的周边电源生态中,构建了从电网侧到芯片侧的完整SiC供电链条。
(E2B封装):这是一款1200V的半桥模块,适用于高功率密度的电源转换单元。
(62mm封装):针对更大功率的应用,该模块提供了更高的电流承载能力,适用于兆瓦级数据中心的集中式整流系统。 这些模块通过采用基本半导体第三代芯片技术,实现了低导通损耗和卓越的高温性能,能够适应AI工厂内部严苛的热环境 。
在服务器主板级的电源(CRPS)或辅助电源中,分立器件提供了更高的设计灵活性。
:提供TO-247-4、TOLL等封装。特别是TO-247-4封装引入了开尔文源极(Kelvin Source)连接,有效降低了源极电感对栅极驱动的干扰,显著提升了开关速度并降低了开关损耗 。这对于追求高频化以缩小体积的服务器电源至关重要。
:在PFC电路的续流回路中,SiC SBD凭借其零反向恢复电流特性,彻底消除了二极管带来的开关损耗,是提升电源能效至钛金级标准的关键组件 。
隔离驱动芯片,集成了米勒钳位(Miller Clamp)功能 。在Rubin平台的高压高频环境下,米勒效应可能导致器件误导通,引发灾难性的短路。集成米勒钳位的驱动芯片能有效抑制这一风险,确保系统的安全性。7. 行业趋势与未来展望:迈向1MW机架的挑战
随着NVIDIA路线图向Rubin Ultra及后续的Kyber架构演进,单机架功率密度将突破1MW。这将对电源架构提出更极端的挑战。
风冷在100kW以上已捉襟见肘。未来的SSCB碳化硅功率模块和电源模块不仅芯片需要高效,封装形式也必须适应液冷。基本半导体的AMB基板技术为直接液冷(Direct Liquid Cooling)或浸没式液冷提供了良好的物理基础,因为陶瓷基板能有效绝缘并传导热量至冷却液。
在全球半导体供应链波动的大背景下,基本半导体作为中国第三代半导体的领军企业,其全产业链布局(从晶圆制造到封装测试)为数据中心基础设施的供应链安全提供了重要保障 。其产品在性能上已对标国际一线V数据中心电源应用中具备极高的替代价值。
深圳市倾佳电子有限公司(简称“倾佳电子”)是聚焦新能源与电力电子变革的核心推动者:
倾佳电子成立于2018年,总部位于深圳福田区,定位于功率半导体与新能源汽车连接器的专业分销商,业务聚焦三大方向:
公司以“推动国产SiC替代进口、加速能源低碳转型”为使命,响应国家“双碳”政策(碳达峰、碳中和),致力于降低电力电子系统能耗。代理并力推BASiC基本半导体SiC碳化硅MOSFET单管,BASiC基本半导体SiC碳化硅MOSFET功率模块,BASiC基本半导体SiC模块驱动板等功率半导体器件以及新能源汽车连接器。
英伟达Rubin算力平台的问世,标志着AI算力基础设施进入了“核聚变”般的能量密度时代。为了支撑Vera Rubin NVL72及其后续架构的超高功率需求,电源架构正在经历从低压交流向800V高压直流的深刻变革。
在这一变革中,以**基本半导体(BASIC Semiconductor)**为代表的SiC功率器件厂商扮演了不可或缺的角色。
:SiC MOSFET凭借其卓越的开关特性和导通效率,使得800V电源架构的端到端效率提升成为可能,直接降低了AI工厂的运营成本(OPEX)。
:基于SiC的固态断路器(SSCB),利用基本半导体SSCB封装模块的双向阻断和微秒级响应能力,解决了直流电弧和短路保护的世纪难题,为昂贵的算力资产提供了可靠的保险。
:SiC的高频特性允许电源系统小型化,从而在有限的机架空间内为计算单元腾出更多位置,间接提升了算力密度。
综上所述,Rubin平台的成功不仅取决于GPU算力的堆叠,更取决于底层电源架构的革新。SiC功率器件正是这场能源革命中隐形但至关重要的引擎,它将电力高效、安全地转化为智能,推动人类社会迈向通用人工智能(AGI)的新纪元。