英伟达|24万买了不亏 NVIDIA最强显卡H100超算小试牛刀:能效无敌

英伟达|24万买了不亏 NVIDIA最强显卡H100超算小试牛刀:能效无敌

文章图片


【英伟达|24万买了不亏 NVIDIA最强显卡H100超算小试牛刀:能效无敌】今天全球TOP500超算半年一次的排行升级了 , TOP10中新面孔不多 , 只有一台是新的 , 最好的还是基于AMD处理器及加速卡的Frontier , 也是唯一的一套百亿亿次超算 。
准确来说 , Frontier是唯一一个经过TOP500认证的百亿亿次超算 , 国内实际上也有2套百亿亿次超算 , 但是没有参与TOP500比赛了 。
不过本文的重点不是超算性能 , 而是另一个侧重能效的Green500超算 , 这次排行第一的是Henri超算 , 基于联想ThinkSystem SR670 V2 , CPU是Intel的Icelake架构至强Platinum 8362 , GPU加速卡则是NVIDIA的H100 80GB PCIe显卡 。
这也是H100加速卡在超算中的首秀 , 但联想这套超算是个小型系统 , 仅有5920个核心 , 整体性能只有2PFLOPS , 在TOP500中只能位列406位 , 但它的优点是能效 , 达到了65.091GFLOPS/W 。
这个能效虽然是当前最强的 , 但好像没比AMD平台的Frontier超算的能效高多少?是这样的 , Frontier的能效当然也很厉害 , 不过Henri超算现在的问题是时间紧促 , 系统根本没有调好 , 现在的表现还是有问题的 , 有很大的优化空间 。
总的来说 , H100在超算中的首秀显示出了惊人的一面 , 那就是能效非常好 , 未来随着出货的增加 , 基于H100的超算性能位列TOP5甚至问鼎第一都有可能 。
H100加速卡今年3月份的GTC大会上发布 , 距今刚好半年了 , 采用Hopper架构 , GH100大核心 , 台积电4nm制造工艺、CoWoS 2.5D封装技术 , 集成800亿个晶体管 , 核心面积814平方毫米 。
它拥有18432个CUDA核心、576个Tensor核心、60MB二级缓存 , 支持6144-bit位宽的六颗HBM3/HBM2e , 支持PCIe 5.0 , 支持第四代NVLink总线 。
售价方面 , H100的官方建议价一直没公布 , 但日本市场之前预售的价格是475万日元 , 约合人民币24万元 , 作为当前性能最强的计算卡 , 这个价格对行业用户来说不亏 。