60 TFLOPS
英伟达H100的算力为 60 TFLOPS ,具体分析如下:
-
基础参数
-
根据官方数据,H100采用Hopper架构和台积电4nm工艺,集成800亿晶体管,配备80GB HBM3显存。
-
其FP32单精度浮点运算能力为60 TFLOPS,FP16(半精度)算力提升3倍,达到120 TFLOPS。
-
-
与FP32的算力对比
- 若以FP32精度计算,10000p(即10000个FP32运算单元)相当于TF32精度的5000p(即5000个TF32运算单元)。
-
实际应用中的扩展性
- 通过多卡并行计算,8卡H100服务器可提供约48 TFLOPS的FP32算力(8 x 6 TFLOPS)。
H100的标称算力为 60 TFLOPS ,实际应用中可通过扩展硬件配置进一步提升。