《海通国际电子》-Nvidia GTC亮点摘要
展开
《海通国际电子》-Nvidia GTC亮点摘要
*LLM需求:LLM规模每6个月翻倍,也要求Token的数量同步增长,两者相乘则为对算力的需求。可以等效理解为对算力需求每六个月4倍增长。
🌟发布Blackwell GPU:两颗Die组合,2080亿晶体管,相较Hopper 5x AI性能,4x on-die存储容量;20 petaFLOPS算力,192GB HBM3e,8TB/s内存带宽。具备RAS Engine可以进行自我检测。
🌟发布GB200:2颗B200+Grace CPU,具备72核心CPU,共40 petaFLOPS算力,16TB/s HBM以及3.6TB/s Nvlink带宽,搭配Bluefield DPU以及Connectx-800G Infiniband。
🌟推出GB200 NVL72:1rack具备18tray,对应36 Grace CPU+72 GPU。全部采用NVlink互联,共1.4 exaFLOPS算力,30TB HBM3e,支持FP4数据格式(大幅提升推理性能);标配液冷;NVlink Chip采用TSMC N4P,72端口,200GB/s SerDes,内置4NVlink 1.8TB/s。具备3.6 TFLO PS FP8算力,用于GPU互联。
🌟性能对比:采用NVL72进行训练,相比Hopper,性能为4x,能耗变为1/4;进行推理,性能30x;较B200架构也大幅提升。
*推出Nvidia Inference Microservice:英伟达Pre-train AI模型,可以理解为开发者工具,便于垂类模型部署。
*相关行业:只要被数据化的要素均可以用于Gen AI(文字、语音、视频、甚至基因,脑电波)。Earth 2-天气预测大模型;Nvidia Healthcare-BioNeMo用于制药等。汽车-与奔驰、JLR等合作。机器人- ISAA C Robotic stack(帮助训练机器人)。
*逻辑:上游-AI datacenter利用Gen AI进行计算;中游-OVX数字孪生进行模拟,并训练机器人;下游-机器人执行(AGX单元)。
*LLM需求:LLM规模每6个月翻倍,也要求Token的数量同步增长,两者相乘则为对算力的需求。可以等效理解为对算力需求每六个月4倍增长。
🌟发布Blackwell GPU:两颗Die组合,2080亿晶体管,相较Hopper 5x AI性能,4x on-die存储容量;20 petaFLOPS算力,192GB HBM3e,8TB/s内存带宽。具备RAS Engine可以进行自我检测。
🌟发布GB200:2颗B200+Grace CPU,具备72核心CPU,共40 petaFLOPS算力,16TB/s HBM以及3.6TB/s Nvlink带宽,搭配Bluefield DPU以及Connectx-800G Infiniband。
🌟推出GB200 NVL72:1rack具备18tray,对应36 Grace CPU+72 GPU。全部采用NVlink互联,共1.4 exaFLOPS算力,30TB HBM3e,支持FP4数据格式(大幅提升推理性能);标配液冷;NVlink Chip采用TSMC N4P,72端口,200GB/s SerDes,内置4NVlink 1.8TB/s。具备3.6 TFLO PS FP8算力,用于GPU互联。
🌟性能对比:采用NVL72进行训练,相比Hopper,性能为4x,能耗变为1/4;进行推理,性能30x;较B200架构也大幅提升。
*推出Nvidia Inference Microservice:英伟达Pre-train AI模型,可以理解为开发者工具,便于垂类模型部署。
*相关行业:只要被数据化的要素均可以用于Gen AI(文字、语音、视频、甚至基因,脑电波)。Earth 2-天气预测大模型;Nvidia Healthcare-BioNeMo用于制药等。汽车-与奔驰、JLR等合作。机器人- ISAA C Robotic stack(帮助训练机器人)。
*逻辑:上游-AI datacenter利用Gen AI进行计算;中游-OVX数字孪生进行模拟,并训练机器人;下游-机器人执行(AGX单元)。
话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!