热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

駿HaYaO
居住在网络的尛麻雀
AMD 发布首份 Zen 6 性能监控文件,揭露其微架构细节,证实 Zen 6 并非 Zen 5 的渐进式改进,而是全新设计,采用台积电 2nm 制程,针对数据中心优化。
Zen 6 核心采用 8 宽分派引擎与同时多线程(SMT)技术,两线程动态竞争资源,强调吞吐量而非单线程极致性能。与 Apple 宽核心相比,单线程表现或稍逊,但适合高并行工作负载。文件显示专用计数器追踪未用分派槽与线程仲裁损失,凸显 AMD 对宽度设计的重视。
向量运算能力大幅强化,支持全宽 AVX-512,涵盖 FP64、FP32、FP16、BF16 等格式,并具 FMA/MAC 与混合浮点-整数指令(如 VNNI、AES、SHA)。512 位元吞吐量极高,甚至需合并计数器精准测量,显示其在密集数学运算的强大潜力。
Zen 6 首度以数据中心为核心设计理念,EPYC「Venice」将支持最高 256 核心。客户端版本功能保留待观察,但整体而言,Zen 6 将成为计算密集型应用的性能怪兽。
22
钻石晶片散热(Diamond Thermal Solution),核心目的就是对应 NVIDIA AI GPU TDP 快速爬升带来的系统与机房散热压力:
1. 钻石材料的降热阻优势
传统「铜盖+TIM+冷板」的热路径在 700W 左右就已相当吃紧,热阻主要卡在晶片到冷板之间那几百微米的界面区。铜的导热率约 400 W/m·K,高阶多晶 CVD 钻石可达 1000–1500 W/m·K,单晶甚至逼近 2000 W/m·K,等于至少是铜的 3–5 倍。把钻石导入晶片层级(取代目前 TIM 材料),在相同厚度与面积下,垂直热阻可望下降 50%以上,实务上对 1–2kW 级 GPU 有机会拉低接面温度 10–20°C,或在维持原本温度上限的前提下,多吃几百瓦功率。这让 B200/B300 往 1.2–1.4kW、Rubin/Ultra 往 2.3–3.5kW 推进时,同一套液冷或浸没冷却硬件还能多撑好几个世代,也替单机与机柜堆更多 GPU 留出热设计空间。
2. 封装可靠度寿命大提升
功耗一路爬到 2,000W 甚至 3,000W 以上时,封装、载板与机板承受的温度梯度与热应力会呈倍数放大,轻则造成封装翘曲与 TIM 泡洞,重则导致焊点疲劳、RDL/凸块裂开,影响长期可靠度。钻石 heat spreader 不只垂直导热好,面内导热也极高,可在几毫米的距离内快速摊平 hotspot,把原本集中在局部区域的 300–500W 热峰值摊散出去,让晶片内不同区块的温差大幅缩小。这等于在帮封装与基板「卸压」:硅、封装材料与基板之间的热膨胀不匹配被缓和,封装翘曲与焊点疲劳周期被拉长。对 Rubin / Rubin Ultra / Feynman 这类高功耗 GPU 而言,长时间 LLM 训练与推理服务可以更接近名义频率稳定运转,减少因过热降频或异常重跑造成的算力浪费,也拉高整体 MTBF 与寿命。
3. 机房成本与扩展弹性化
当单颗 GPU TDP 更高时,整柜功率很快就逼近或突破 120kW、130kW,机房的配电与冷却基础设施都要大改版。如果晶片端不提升导热能力,只能不断堆更昂贵的 CDU、冷却塔与配电架构,而且为了压温度常被迫把冷却水温拉得很低、流量开到极限。导入钻石晶片散热后,单颗 GPU 在相同水温与流量下温度较低、降频概率下降,每个机柜可提供的「稳定算力 per rack」实际上提高;同时因为热阻降低,也有机会允许较高一点的水温或较低的流量,减少泵浦与 chiller 能耗。更重要的是,它为后续 Rubin Ultra、Feynman 这种 3.5kW~5kW 级 GPU 预先打开热设计弹性,让系统厂与云端业者在规划下一代 AI 丛集时,可以把钻石散热视为一个「材料级升级选项」,把散热从事后补救变成前期架构设计的一环,而不是等热崩了才回头想办法。

124
热门
排行
收藏

