电子发烧友网归纳报导 音讯称,特供NVIDIA正在为我国商场研制一款名为“B30”的芯片降规版。AI
。光没芯片
,特供这款芯片将首度支撑多。芯片GPU。光没扩展,特供答使用户经过衔接多组芯片来打造更高功用的芯片核算集群。B30芯片估计将选用最新的光没Bl
。ac
。特供kwell架构 ,芯片运用GDDR7显存
,光没而非高频宽内存(HBM),特供也不会选用台积电的芯片先进封装技能。
不少人以为多GPU扩展才能指的光没是NVLink,但NVIDIA已在其消费级GPU芯片中取消了NVLink支撑
,因而B30是否支撑NVLink现在还不能确认 。有音讯称B30芯片的多GPU互联功用或许根据NVIDIA的ConnectX-8 SuperNICs技能,这一技能曾在Compu。te
。x 2025上展现,用于衔接RTX Pro 6000 GPU。
NVIDIA ConnectX-8 SuperNIC是业界首款在单个设备中集成支撑 PCIe Gen6 的。交换机。和超高速网络的 SuperNIC。ConnectX-8 专为现代 AI 根底架构规划,可提供更高的吞吐量
,一起简化体系规划并进步功耗和本钱效益 。
NVIDIA ConnectX-8 正在从头界说根据 PCIe 的体系的或许性 。经过将 PCIe Gen6 交换机和高功用 SuperNIC 集成到单个集成设备中
,ConnectX-8 可简化服务器规划
,削减组件数量 ,并解锁现代 AI 作业负载所需的高带宽。通讯
。途径。然后打造更简略、更节能的渠道,一起下降全体具有本钱 (TCO) 并完成超卓的功用可扩展性
。
此外,ConnectX-8 SuperNIC 还可在根据多 GPU 的渠道中完成增强的秘要核算才能
。
B30与H20存在功用差异,首要体现在几个方面:1 、显存技能差异,H20芯片选用HBM3显存,带宽高达4.0TB/s,而B30芯片估计运用GDDR7显存
,带宽或许降至1.7TB/s左右。HBM3在带宽和能效比上显着优于GDDR7,特别在处理大规划数据集时,H20的显存功用优势将更显着。
2、互联技能比照
:H20支撑NVLink技能
,卡间互联带宽高达900GB/s,合适构建大规划核算集群。B30芯片的多GPU扩展功用或许依靠ConnectX-8 SuperNICs技能 ,而非NVLink,其互联带宽和推迟或许不及H20,在需求低推迟通讯的场景中体现或许受限。
3、功用定位差异 :H20芯片在FP8和FP16精度下的Tensor Core功用分别为296
。 TF。LOPS和148 TFLOPS,适用于。高精度。核算使命
。B30芯片作为降规版,单芯片算力或许低于H20,但经过多GPU扩展可提高全体功用,合适对本钱灵敏但需求必定扩展性的使用场景。
4
、使用场景适配:H20芯片在垂类模型练习和推理使命中体现优异
,特别合适需求高带宽和低推迟的场景。B30芯片则更侧重于经过多GPU扩展满意中小规划核算需求,或许在性价比和灵活性上更具优势,但单芯片功用或许无法与H20比美。
与华为昇腾910等国产芯片比较
,B30系列在显存容量上占优,但价格和能效比或许处于下风。B30价格预估为6500-8000美元,较H20的1-1.2万美元下降约40%,但仍高于部分国产芯片
。
B30在我国商场的开展面对应战。如技能约束,显存带宽和
。接口。简化导致功用下降 ,或许无法满意高端客户需求,长时间来看,技能约束或许削弱NVIDIA在我国商场的竞争力。商场承受度上