海通国际电子》-Nvidia GTC亮点摘要[淘股吧]

*LLM需求:LLM规模每6个月翻倍,也要求Token的数量同步增长,两者相乘则为对算力的需求。可以等效理解为对算力需求每六个月4倍增长。

🌟发布Blackwell GPU:两颗Die组合,2080亿晶体管,相较Hopper 5x AI性能,4x on-die存储容量;20 petaFLOPS算力,192GB HBM3e,8TB/s内存带宽。具备RAS Engine可以进行自我检测。

🌟发布GB200:2颗B200+Grace CPU,具备72核心CPU,共40 petaFLOPS算力,16TB/s HBM以及3.6TB/s Nvlink带宽,搭配Bluefield DPU以及Connectx-800G Infiniband。

🌟推出GB200 NVL72:1rack具备18tray,对应36 Grace CPU+72 GPU。全部采用NVlink互联,共1.4 exaFLOPS算力,30TB HBM3e,支持FP4数据格式(大幅提升推理性能);标配液冷;NVlink Chip采用TSMC N4P,72端口,200GB/s SerDes,内置4NVlink 1.8TB/s。具备3.6 TFLO PS FP8算力,用于GPU互联。

🌟性能对比:采用NVL72进行训练,相比Hopper,性能为4x,能耗变为1/4;进行推理,性能30x;较B200架构也大幅提升。

*推出Nvidia Inference Microservice:英伟达Pre-train AI模型,可以理解为开发者工具,便于垂类模型部署。

*相关行业:只要被数据化的要素均可以用于Gen AI(文字、语音、视频、甚至基因,脑电波)。Earth 2-天气预测大模型;Nvidia Healthcare-BioNeMo用于制药等。汽车-与奔驰、JLR等合作。机器人- ISAA C Robotic stack(帮助训练机器人)。

*逻辑:上游-AI datacenter利用Gen AI进行计算;中游-OVX数字孪生进行模拟,并训练机器人;下游-机器人执行(AGX单元)。