发布日期:2024-05-04 04:40 点击次数:149
克雷西 萧箫 发自 凹非寺量子位 | 公众号 QbitAI
他来了他来了,老黄带着「最强生成式AI惩办器」和一系列重磅更新来了!
在规划机图形学顶会SIGGRAPH上,老黄告示了最新的超等芯片NVIDIA DGX GH200 Grace Hopper。
这块芯片搭载了各人最快的内存,不仅带宽每秒5TB,内存容量更是暴增接近50%来到141GB,「任何鬼话语模子齐能运转」。
同期,英伟达还告示了和Hugging Face的合营——
以后在Hugging Face平台上,不需要再下载ML模子我方运转,只需要几步粗浅操作,就能在札记本上运转大模子,有Colab内味了(等于不知谈有莫得免费版)。
至于软件更新,字里行间也全是AI。
不仅在Omniverse平台中集成了一系列时下热点的AI器具,新的软件有不少亦然基于大模子打造,像ChatUSD就能帮成就者们写代码。
这亦然时隔五年,老黄再次登上SIGGRAPH的舞台。在会上,他自信满满地告示:
生成式东谈主工智能的「iPhone时刻」,照旧莅临。
有网友看完发布会后感喟:
英伟达在AI硬件这方面,照旧无东谈主能及了。
广东体育频道app官网新芯片构成的「最强超算」来袭
这场发布会中发轫抛出,亦然最引东谈主瞩运筹帷幄,非「最强超算」莫属。
这台超等规划机由256块DGX GH200 Grace Hopper(简称DGX GH200)勾通而成。
用老黄的话,这个「大而无当」等于为AIGC时期量身打造的。
它的算力和内存容量分手达到了1E(10^15)FLOPS和144TB。
底下这张图展示了它的实在大小(中间的黑影是老黄)。
不仅是性能优异,对比发现,性价比简直完爆CPU。
一样花1亿好意思元,拿来买CPU和GPU分手能取得什么?
CPU的话,可以买8800个x86架构的产物。
这近九千块CPU加起来,只可带动一个LLaMA 2、SDXL这么限制的AI顺次。
功率嘛……是5兆瓦,也等于每小时5000度电。
若是换成GPU的话,则是2500块DGX GH200。
能带动的肖似限制的AI顺次一下增多到了12个,功率却镌汰到了3兆瓦。
平均到单个顺次上,需要210块DGX GH200,价钱是800万好意思元,功率则为0.26兆瓦。
而构成这个「最强超算」的DGX GH200,一样是王者级别,被称为「最强生成式AI惩办器」。
DGX GH200由Grace CPU和Hopper GPU构成。
其中Grace CPU包含72中枢,尔后者领有4P(10^12)FLOPS的算力和500GB的LPDDR5X。
此外,DGX GH200中还加入了海力士的「最快内存」HBM3e。
它的容量为141GB,带宽则高达每秒5TB,分手是H100的1.7倍和1.55倍。
(好家伙,H100齐只配当baseline了)
在DGX GH200中,CPU和GPU之间的勾通速率是第五代PCIe的7倍。
而从单块DGX GH200到通盘超等规划机的经过,主打的等于一个「叠」。
这要获利于它的多GPU高速勾通才略。
双联体的DGX GH200,性能险些莫得赔本,胜仗等于单体的两倍。
将双联体的DGX GH200与BlueField-3 DPU和ConnectX-7网卡,就构成了一个「规划盒」。
通过NVLink,8个这么的「规划盒」高速勾通,就取得了DGX构建块,总内存达到了4.6TB。
这么的构建块可以合二为一变成新的规划盒,并最终膨大成256 GPU的责任集群Superpod。
NVLink的高速勾通才略,让这256块GPU「就像是一块一样」责任。
至此,显卡超算的限制照旧达到了本节开首老黄所展示的水平。
但这还莫得抵制——Superpod之间还能赓续勾通。
在高速低延时的Quantum-2 Infiniband平台匡助下,超算的限制可以接着膨大……
讲到这里,老黄还玩笑谈:
若是哪天你从(某电商平台)上买显卡的期间发现了它,千万不要以为惊诧!
总之,笔据不同需要,诈欺DGX GH200将能构建出不同限制的、合乎AIGC时期的超等规划机。
据权衡,DGX GH200将于明(2024)年第二季度投产。
还发了3个RTX新专科显卡
除了「最强生成式AI惩办器」除外,英伟达此次也推出了3款船新的责任站显卡:
RTX 5000、RTX 4500和RTX 4000。
这几款显卡均基于Ada Lovelace架构联想,现时参数照旧同步英伟达官网:
虽然,专科显卡售价也更贵。
其中RTX 5000售价达到4000好意思元(约合东谈主民币2.87万元),RTX 4500售价2250好意思元(约1.6万元),RTX 4000售价1250好意思元(约8987元)。
老黄也在发布RTX显卡时,再次说出那句经典名言:
买得越多,省得越多(the more you buy, the more you save)。
至于旧年9月发布的RTX 6000 Ada显卡,在此次大会上也推出了一个新的责任站联想:4块叠起来,搞个顶级「叠叠乐」。
这么联想的单个RTX责任站,单个可以提供5828 TFLOPS的AI性能,以及192GB的GPU内存。
今年二季度,中国贸促会对来自全国26个省区市的近800家外资企业进行调研访问,其中,59.82%的受访外资企业来自加工制造环节,64.6%为小微企业,形成了《2023年第二季度中国外资营商环境调研报告》。
除此之外,老黄还在此次大会上告示了一个搭载L40S Ada GPU的新款OVX就业器,数据中心专用。
每台就业器搭载8块L40S Ada GPU,每块L40S包含高达18176个CUDA中枢,可以提供近5倍于A100的单精度浮点(FP32)性能。
比较A100,L40S微调(fine-tune)大模子的性能晋升了约莫1.7倍。
(没错,A100照旧被老黄用来给新硬件当对比了)
具体来说,在这个OVX就业器上微调一个860M参数的大模子,现时只需要7小时就可以完成;
400亿参数的GPT-3大模子,更是只需要15个小时就能微调完成。
在渲染上,L40S性能也可以,配备了142个第三代RT中枢,可以提供212 teraflops的光泽跟踪性能。
权衡L40S将于本年秋季上市。
太阳城视频黄在线皇冠客服飞机:@seo3687AIGC版Colab来了,札记本跑大模子
不仅是硬件上接连抛出一系列「重磅炸弹」,软件方面英伟达也发布了多款新产物。
www.premiersportshq.com最初是和HuggingFace合营,把NVIDIA DGX Cloud AI整合到其中。
在HF的页面中,一键就能让模子在云上转机运转。
英伟达科学家范麟熙(Jim Fan)欣慰地告示了这一音问,还泄漏其中使用的每个节点齐是8个H100或A100。
除了与HF合营,英伟达还推出了我方的Workbench平台。
通过勾通云表就业,用札记本电脑就能跑大模子。
现场还播放了通过Workbench跑SDXL的演示视频。
在Jupyter中,演示者让SDXL画一个「玩物老黄」。
此时的SDXL还不知谈「玩物老黄」是个啥玩意儿。
于是演示者现场用8张图对模子进行了微调。
微调后重新绘画的作品,是不是有那味了?
除了上述两款大模子运转器具,英伟达还推出了最新版的企业软件平台NVIDIA AI enterprise 4.0。
软件包的数目达到了4500个,还独特以万计的联系依赖,况且安全可靠。
谷歌、微软、亚马逊、甲骨文等英伟达合营方齐会在我方的云平台中集成这项就业。
「东谈主类将成为一门新的编程话语」
除此之外,英伟达的规划机图形与仿真模拟平台Omniverse,也告示了一系列新阐明。
一方面,更多AI器具可以胜仗在Omniverse内部调用了。
包括对话式AI脚色创建器具Convai、高保真AI动捕器具Move AI、AI低资本制作CG器具CGWonder Dynamics在内,一系列流行AI器具,现时齐照旧通过OpenUSD集成到Omniverse中。
就连Adobe,也缱绻将Adobe Firefly看成API,提供在Omniverse中(等于臆想会收费)。
另一方面,英伟达还将生成式AI技能和OpenUSD结合,推出了一些好用的AI器具。
香港六合彩娱乐城举例ChatUSD,等于一个基于NVIDIA Nemo框架大模子Copilot,不仅可以修起成就者关系USD的问题,还能维护生成Python-USD代码。
又举例DeepSearch,亦然一个基于大模子的新器具,基于文本或图像输入,可以快速对数据库进行3D语义搜索。
在此次大会上,老黄先是总结了我方已往所作念的「正确决定」——用AI重塑CG,为AI重新发明GPU。
随后,他对异日AI行业的发展作念了斗胆的瞻望:
异日,险些通盘事物的前线齐会有一个鬼话语模子。「东谈主」,将成为一种新的编程话语。
以工场为例,老黄认为,异日的工场将会由软件和机器东谈主来「垄断」。
新宝网址像汽车这么的产物,本人等于机器东谈主,是以坐褥汽车的工场,将会呈现出机器东谈主制造机器东谈主的步地。
看来,乘大模子东风速即崛起的英伟达,此次是的确要ALL IN生成式AI了。
参考集合:[1]https://www.anandtech.com/show/20001/nvidia-unveils-gh200-grace-hopper-gpu-with-hbm3e-memory[2]https://twitter.com/DrJimFan/status/1688954935248027648[3]https://tehcrunch.com/2023/08/08/nvidia-ceo-we-bet-the-farm-on-ai-and-no-one-knew-it[4]https://www.youtube.com/watch?v=3qSQjRaseos