您的当前位置:首页 > 经济 > 正文

热消息:英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练

  • 2023-06-28 08:05:44 来源:金融界


(资料图片仅供参考)

当地时间周二,机器学习及人工智能领域开放产业联盟MLCommons披露两项MLPerf基准评测的最新数据,其中英伟达H100芯片组在人工智能算力表现的测试中,刷新了所有组别的纪录,也是唯一一个能够跑完所有测试的硬件平台。

(来源:英伟达、MLCommons)

MLPerf是由学术界、实验室和产业组成的人工智能领袖联盟,是目前国际公认的权威AI性能评测基准。Training v3.0包含8种不同的负载,包括视觉(影像分类、生物医学影像分割、两种负载的物体侦测)、语言(语音识别、大语言模型、自然语言处理)和推荐系统。简单来说,就是由不同的设备供应商提交完成基准任务所需要的时间。

(Training v3.0训练基准,来源:MLCommons)

在投资者比较关注的“大语言模型”训练测试中,英伟达和GPU云算力平台CoreWeave提交的数据为这项测试设定了残酷的业界标准。在896个英特尔至强8462Y+处理器和3584个英伟达H100芯片的齐心协力下,仅仅花了10.94分钟就完成了基于GPT-3的大语言模型训练任务。

除了英伟达外,只有英特尔的产品组合在这个项目上获得评测数据。由96个至强8380处理器和96个Habana Gaudi2 AI芯片构建的系统中,完成同样测试的时间为311.94分钟。横向对比,使用768个H100芯片的平台跑完这个测试也只需要45.6分钟。

(芯片越多数据越好看,来源:英伟达)

对于这个结果,英特尔也表示仍有上升空间。理论上只要堆更多的芯片,运算的结果自然会更快。英特尔AI产品高级主管Jordan Plawner对媒体表示,接下来Habana的运算结果将会呈现1.5倍-2倍的提升。Plawner拒绝透露Habana Gaudi2的具体售价,仅表示业界需要第二家厂商提供AI训练芯片,而MLPerf的数据显示英特尔有能力填补这个需求。

而在中国投资者更熟悉的BERT-Large模型训练中,英伟达和CoreWeave将数据刷到了极端的0.13分钟,在64卡的情况下,测试数据也达到了0.89分钟。BERT模型中的Transformer结构正是目前主流大模型的基础架构。

标签:

推荐阅读

热消息:英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练

当地时间周二,机器学习及人工智能领域开放产业联盟MLCommons披露两项M

冰箱不是“保险箱”!这四类食物不建议长时间放冰箱 天天热头条

炎炎夏日食物容易变质不少人认为将食物直接放在冰箱里足够安全可靠果真

揪心!突发山洪泥石流!7人失联

汶川县应急管理局关于汶川县突发山洪泥石流灾害的情况通报

“一城双展”,第15届中国西部房.车博览会7月8日精彩亮相建发悠阅城

“一城双展”,第15届中国西部房 车博览会7月8日精彩亮相建发悠阅城,盛

环球微资讯!顺遂无虞是什么意思解释_顺遂

1、万事顺遂一切顺利、如意(遂心)。本文分享完毕,希望对大家有所帮

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲时报网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

关注