传说中的英伟达 GH200 在 MLPerf 3.1 中惊艳亮相,性能直接碾压 H100,领先了 17%。
继 4 月份加入 LLM 训练测试后,MLPerf 再次迎来重磅更新!
刚刚,MLCommons 发布了 MLPerf v3.1 版本更新,并加入了两个全新基准:LLM 推理测试 MLPerf Inference v3.1,以及存储性能测试 MLPerf Storage v0.5。
而这,这也是英伟达 GH200 测试成绩的首次亮相!
相比于单张 H100 配合英特尔 CPU,GH200 的 Grace CPU+H100 GPU 的组合,在各个项目上都有 15% 左右的提升。
英伟达 GH200 超级芯片首秀
毫无疑问,英伟达的 GPU 在 MLPerf Inference 3.1 基准测试中表现是最亮眼的。
其中,最新发布的 GH200 Grace Hopper 超级芯片,也是首次在 MLPerf Inference 3.1 上亮相。
Grace Hopper 超级芯片将英伟达的 Grace CPU 与 H100 GPU 集成在一起,通过超高的带宽连接,从而比单个 H100 配合其他的 CPU 能提供更强的性能表现。
「Grace Hopper 首次展示了非常强劲的性能,与我们的 H100 GPU 提交相比,性能提高了 17%,我们已经全面领先,」英伟达人工智能总监 Dave Salvator 在新闻发布会上表示。
性能大幅增长
具体来说,它将一个 H100 GPU 和 Grace CPU 集成在一起,通过 900GB/s的 NVLink-C2C 连接。
而 CPU 和 GPU 分别配备了 480GB 的 LPDDR5X 内存和 96GB 的 HBM3 或者 144GB 的 HBM3e 的内存,集成了高达 576GB 以上的高速访问内存。
英伟达 GH200 Grace Hopper 超级芯片专为计算密集型工作负载而设计,能够满足各种严苛的要求和各项功能。
比如训练和运行数万亿参数的大型 Transformer 模型,或者是运行具有数 TB 大小的嵌入表的推荐系统和向量数据库。
GH200 Grace Hopper 超级芯片还在 MLPerf Inference 测试中有着非常优异的表现,刷新了英伟达单个 H100 SXM 在每个项目中创下的最佳成绩。
GH200 Grace Hopper 超级芯片集成了 96 GB 的 HBM3,并提供高达 4 TB / s 的 HBM3 内存带宽,而 H100 SXM 分别为 80 GB 和 3.35 TB / s。
与 H100 SXM 相比,更大的内存容量和更大的内存带宽使得在 NVIDIA GH200 Grace Hopper 超级芯片上使用更大的批处理大小来处理工作负载。
例如,在服务器场景中,RetinaNet 和 DLRMv2 的批处理大小都增加了一倍,在离线场景中,批处理大小增加了 50%。
GH200 Grace Hopper 超级芯片在 Hopper GPU 和 Grace CPU 之间的高带宽 NVLink-C2C 连接可以实现 CPU 和 GPU 之间的快速通信,从而有助于提高性能。
例如,在 MLPerf DLRMv2 中,在 H100 SXM 上通过 PCIe 传输一批张量大约需要 22% 的批处理推理时间。
使用了 NVLink-C2C 的 GH200 Grace Hopper 超级芯片仅使用 3% 的推理时间就完成了相同的传输。
由于具有更高的内存带宽和更大的内存容量,与 MLPerf Inference v3.1 的 H100 GPU 相比,Grace Hopper 超级芯片的单芯片性能优势高达 17%。
推理和训练全面领先
在 MLPerf 的首秀中,GH200 Grace Hopper Superchip 在封闭类别的所有工作负载和场景上都表现出卓越的性能。
而在主流的服务器应用中,L4 GPU 能够提供一个低功耗,紧凑型的算力解决方案,与 CPU 解决方案相比的性能也有了大幅的提升。
Salvator 表示,「与测试中最好的 x86 CPU 相比,L4 的性能也非常强劲,提高了 6 倍」。
对于其他的 AI 应用和机器人应用,Jetson AGX Orin 和 Jetson Orin NX 模块实现了出色的性能。未来的软件优化有助于进一步释放强大的英伟达 Orin SoC 在这些模块中的潜力。
在目前非常流行的目标检测 AI 网络 ——RetinaNet 上,英伟达的产品的性能提高了高达 84%。
英伟达开放部分的结果,展示了通过模型优化可以在保持极高精度的同时大幅提高推理性能的潜力。
全新 MLPerf 3.1 基准测试
当然,这并不是 MLCommons 第一次尝试对大语言模型的性能进行基准测试。早在今年 6 月,MLPerf v3.0 就首次加入了 LLM 训练的基准测试。不过,LLM 的训练和推理任务,区别很大。
推理工作负载对计算要求高,而且种类繁多,这就要求平台能够快速处理各种类型的数据预测,并能在各种 AI 模型上进行推理。
对于希望部署 AI 系统的企业来说,需要一种方法来客观评估基础设施在各种工作负载、环境和部署场景中的性能。所以对于训练和推理的基准测试都是很重要的。
MLPerf Inference v3.1 包括了两项重要更新,来更好地反映现在 AI 实际的使用情况:
首先,增加了基于 GPT-J 的大型语言模型 推理的测试。GPT-J 是一个开源的 6B 参数 LLM,对 CNN / 每日邮报数据集进行文本总结。
除了 GPT-J 之外,这次还更新了 DLRM 测试。针对 MLPerf Training v3.0 中引入的 DLRM,采用了新的模型架构和更大的数据集,更好地反映了推荐系统的规模和复杂性。
MLCommons 创始人兼执行董事 David Kanter 表示,训练基准侧重于更大规模的基础模型,而推理基准执行的实际任务,则代表了更广泛的用例,大部分组织都可以进行部署。
在这方面,为了能够对各种推理平台和用例进行有代表性的测试,MLPerf 定义了四种不同的场景。
每个基准都由数据集和质量目标定义。
每个基准都需要以下场景:
在 MLPerf v3.1 基准测试中,有超过 13,500 个结果,其中不少提交者的性能比 3.0 基准提高了 20%,甚至更多。
其他提交者包括华硕,Azure,cTuning,Connect Tech,戴尔,富士通,Giga Computing,谷歌,H3C,HPE,IEI,英特尔,Intel Habana Labs,Krai,联想,墨芯,Neural Magic,Nutanix,甲骨文,高通,Quanta Cloud Technology,SiMA,Supermicro,TTA 和 xFusion 等。
参考资料:
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
环旭电子毛利率创上市十年新低,股价跌跌不休,连续回购有
图片来源:图虫3月28日,环旭电子(601231.SH)披露2021年年度报告称,该公司去...
两个20CM涨停,津荣天宇拟10转8派3,上市没满周年
图片来源:图虫创意3月29日,津荣天宇(300988.SZ)再次“20CM涨停”,收于44...
在管面积翻倍,碧桂园服务称大规模收并购已过去
图片来源:碧桂园服务结束过去一年来的大举收并购后,在3月29日召开的2021年度业绩发布会...
首套房利率降至5.2%,武汉楼市政策也放松了
去年被投资客们看好的武汉楼市,近期也继续出台了楼市刺激政策。界面新闻获悉,武汉房贷利率出现...
英国通胀创30年来最快增速,政府宣布立即降调燃油税
2022年3月9日,英国丹伯里,埃克森美孚公司运营的埃索加油站。图片来源:视觉中国英国政府...
让孩子自信互动才是幼儿园质量“金标准”
让孩子自信互动才是幼儿园质量“金标准” “入园难、入园贵”的问题终于不那么令人焦灼了。近年...
佳通轮胎获行业“十大轮胎品牌”等奖项
近日,由中国轮胎商务网发起主办、善养汽车联合主办的ApexTire2021中国轮胎年度大选...
快手2021年营收811亿元,调整后净亏损188.5亿
,快手今日公布了2021年第四季度及全年财报。财报显示,该公司第四季度营收244亿元,同比...
奇安信2022年新增订单超9亿元同比增长超65%
3月29日,奇安信发布关于近期经营情况的公告。公告显示,目前公司在手订单超23亿元,202...
大摩:苹果、谷歌等大型科技企业股票反弹,亚马逊、英伟达
北京时间3月29日早间消息,据报道,摩根士丹利财富管理公司表示,美国主要的科技和互联网股票...
万科蝉联第一2022房企综合实力TOP500测评成果出
3月29日,2022房地产开发企业综合实力测评成果正式发布,“房地产开发企业综合实力TOP...
华为加码芯片研发:海思升格为一级部门
华为本周发布2021年年度报告,从华为2021年的最新业务架构来看,海思已经从2012实验...
LGDisplay加码抢占中国透明显示市场
LGDisplay于3月29日至31日在北京东外56号文创园,以“YourLifewith...
一汽-大众奥迪赛车队加冕中国超级跑车锦标赛2021赛季
2022年3月24日,代表一汽-大众奥迪赛车队出征中国超级跑车锦标赛(ChinaGT)20...
StrategyAnalytics:
根据StrategyAnalytic...
增程技术成2022百人会热门增程式S
3月27日,中国电动汽车百人会论坛(...
工信部:1-2月份我国软件业务收入1
近日,工信部发布《2022年1-2月...
元宇宙进行时,高通在行动
近期,高通宣布设立总金额达1亿美元的...
Ultrasuede®携手智己L7打
环保可持续发展的理念不断融于各行各业...