,没有HBM ,没有NB30曝光A特供芯片

2025-07-04 05:38:52综合

电子发烧友网归纳报导 音讯称,特供NVIDIA正在为我国商场研制一款名为“B30”的芯片降规版。AI 。光没芯片 ,特供这款芯片将首度支撑多 。芯片GPU。光没扩展,特供答使用户经过衔接多组芯片来打造更高功用的芯片核算集群。B30芯片估计将选用最新的光没Bl 。ac 。特供kwell架构,芯片运用GDDR7显存 ,光没而非高频宽内存(HBM),特供也不会选用台积电的芯片先进封装技能。

不少人以为多GPU扩展才能指的光没是NVLink ,但NVIDIA已在其消费级GPU芯片中取消了NVLink支撑 ,因而B30是否支撑NVLink现在还不能确认。有音讯称B30芯片的多GPU互联功用或许根据NVIDIA的ConnectX-8 SuperNICs技能 ,这一技能曾在Compu。te 。x 2025上展现,用于衔接RTX Pro 6000 GPU 。

NVIDIA ConnectX-8 SuperNIC是业界首款在单个设备中集成支撑 PCIe Gen6 的。交换机。和超高速网络的 SuperNIC。ConnectX-8 专为现代 AI 根底架构规划,可提供更高的吞吐量  ,一起简化体系规划并进步功耗和本钱效益。

NVIDIA ConnectX-8 正在从头界说根据 PCIe 的体系的或许性 。经过将 PCIe Gen6 交换机和高功用 SuperNIC 集成到单个集成设备中 ,ConnectX-8 可简化服务器规划 ,削减组件数量 ,并解锁现代 AI 作业负载所需的高带宽 。通讯 。途径。然后打造更简略 、更节能的渠道,一起下降全体具有本钱 (TCO) 并完成超卓的功用可扩展性  。

此外 ,ConnectX-8 SuperNIC 还可在根据多 GPU 的渠道中完成增强的秘要核算才能 。

B30与H20存在功用差异,首要体现在几个方面 :1 、显存技能差异,H20芯片选用HBM3显存,带宽高达4.0TB/s,而B30芯片估计运用GDDR7显存  ,带宽或许降至1.7TB/s左右。HBM3在带宽和能效比上显着优于GDDR7,特别在处理大规划数据集时,H20的显存功用优势将更显着。

2、互联技能比照  :H20支撑NVLink技能 ,卡间互联带宽高达900GB/s,合适构建大规划核算集群 。B30芯片的多GPU扩展功用或许依靠ConnectX-8 SuperNICs技能  ,而非NVLink,其互联带宽和推迟或许不及H20,在需求低推迟通讯的场景中体现或许受限 。

3 、功用定位差异 :H20芯片在FP8和FP16精度下的Tensor Core功用分别为296 。 TF。LOPS和148 TFLOPS,适用于。高精度。核算使命  。B30芯片作为降规版 ,单芯片算力或许低于H20 ,但经过多GPU扩展可提高全体功用 ,合适对本钱灵敏但需求必定扩展性的使用场景。

4 、使用场景适配 :H20芯片在垂类模型练习和推理使命中体现优异  ,特别合适需求高带宽和低推迟的场景。B30芯片则更侧重于经过多GPU扩展满意中小规划核算需求 ,或许在性价比和灵活性上更具优势,但单芯片功用或许无法与H20比美。

与华为昇腾910等国产芯片比较 ,B30系列在显存容量上占优 ,但价格和能效比或许处于下风。B30价格预估为6500-8000美元 ,较H20的1-1.2万美元下降约40%,但仍高于部分国产芯片 。

B30在我国商场的开展面对应战。如技能约束,显存带宽和 。接口。简化导致功用下降 ,或许无法满意高端客户需求,长时间来看,技能约束或许削弱NVIDIA在我国商场的竞争力。商场承受度上,我国客户对功用和本钱的平衡较为灵敏,B30需经过实践体现证明价值  。国产芯片的兴起或许分流部分商场需求,B30需在生态和价格上继续优化 。

别的,出口控制方针或许进一步收紧,影响B30的供应链和商场份额。我国对自主可控技能的注重或许推进国产芯片代替,B30需应对方针不确认性。


发表评论

您必须登录才能发表评论!