橘子百科-橘子都知道橘子百科-橘子都知道

错一个题就往阴里装一支笔

错一个题就往阴里装一支笔 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢家之一、英伟达背(bèi)后的那个身穿黑色皮衣(yī)的男(nán)人又来了。

  前(qián)脚(jiǎo)才交出亮眼(yǎn)业绩狂拉股价,英伟达CEO黄仁勋后脚(jiǎo)就在昨日(rì)的COMPUTEX大会(huì)上宣布(bù),“我(wǒ)们(men)已到达生成式AI引爆(bào)点。从此,全世界(jiè)的(de)每(měi)个角落,都会有计算需求。”

  如今(jīn)英伟达掌(zhǎng)握着全球多(duō)家(jiā)科(kē)技公司“算力命脉”,而(ér)在(zài)这场大会上,黄仁勋激情(qíng)演讲2个小(xiǎo)时,甩出了多项(xiàng)重磅新发布,包括算(suàn)力(lì)“杀器”DGX GH200超(chāo)级计算(suàn)机(jī)、针对游戏的(de)ACE代工服务、MGX服务器(qì)规范等内容。

  算力“杀(shā)器”:DGX GH200超(chāo)级计算机+GH200超级芯(xīn)片

  先看“集成了(le)英伟(wěi)达(dá)最先进加速计(jì)算(suàn)和网络技术”的(de)DGX GH200人工智能超级计算(suàn)机

  这(zhè)款超算专(zhuān)为大规(guī)模(mó)生成式AI的负载所设计,由256块GH200超级芯(xīn)片组成,拥有1 exaflop超凡AI性能、144TB内存(cún)(是英伟达目前DGX A100系统的近500倍(bèi))、150英里(lǐ)光纤、2000多个风扇。

  DGX GH200重达40000磅(约合18143千(qiān)克(kè)),堪比四只(zhǐ)成(chéng)年(nián)大象(xiàng)的体重(zhòng)。

  预计DGX GH200将于今(jīn)年年底投入问(wèn)世,英伟达暂未公(gōng)布(bù)价格(gé),而谷歌云(yún)、Meta与微软将是首批用户

  同时,英伟(wěi)达也正在(zài)打造自家基于DGX GH200的(de)大型AI超(chāo)级计(jì)算机NVIDIA Helios,以支持其研(yán)究和开发团队的(de)工作(zuò)。其(qí)中采(cǎi)用4个DGX GH200系统、1024颗Grace Hopper超级芯(xīn)片,每个都将与英伟达Quantum-2 InfiniBand网络连接,带(dài)宽高达400Gb/s,将于今年年底(dǐ)上线。

  值得(dé)一提的是,黄(huáng)仁(rén)勋(xūn)透露,DGX GH200集成的GH200 Grace Hopper超级(jí)芯片已进入全面生(shēng)产

  “拉踩”CPU:成本、功(gōng)耗、处理数据量不如GPU

  在本次大会上,黄仁勋还“拉(lā)踩(cǎi)”了一波CPU。他(tā)从功(gōng)耗、处理数据量等方面,指(zhǐ)出(chū)使用GPU胜(shèng)过CPU。

  举例来说,花费1000万美元,可以(yǐ)建设一个(gè)有(yǒu)960颗CPU的数(shù)据中心(xīn),其可处(chù)理1X LMM(大语(yǔ)言模型)数(shù)据量,需要(yào)11GWh功耗;

  同样成本下,也可(kě)以建设(shè)一个(gè)有48个GPU的数据中心(xīn),其可处理44X LLM数据(jù)量,仅需要(yào)3.2GWh功(gōng)耗。

  若只想处(chù)理1X LMM数据量,则只需40万美元,便可拥有一(yī)个搭载2个GPU、功耗仅0.13GWh的数据中心。

  “买越多,省越多(The more you buy, the more you save)。”黄仁(rén)勋(xūn)再次表示(shì)。

  同时,他(tā)也列出(chū)了数据中(zhōng)心成本公式(shì):数据中心总持有成本(běn)=f[成(chéng)本(芯片、系(xì)统、硬(yìng)件生态系统)、吞吐量(GPU、Algo软(ruǎn)件(jiàn)、网(wǎng)络、系统软件、软件(jiàn)生态系统(tǒng))、使用率(lǜ)(Algo Lib, 软件生态(tài)系统)、采购运营、生命周期(qī)最佳化、电力]

  ACE代(d错一个题就往阴里装一支笔ài)工服务:用AI激活(huó)NPC生命

  游戏(xì)一直是备受关注的一大AI应(yīng)用落地领(lǐng)域。英伟达(dá)也在大会上宣布,推出面向(xiàng)游(yóu)戏(xì)的定制AI模(mó)型代工服(fú)务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它(tā)能赋(fù)予非玩家角色(NPC)更智能且不(bù)断进(jìn)化的对(duì)话技能,中间件、工具(jù)和游戏(xì)开(kāi)发(fā)者可使用它(tā)来构建(jiàn)和部署(shǔ)定制的语音、对话和动画AI模(mó)型

  其中包括:英(yīng)伟达NeMo,使用专有数据构建、定制和部署语言模型;英伟达(dá)Riva,用于自动语音(yīn)识别和文本(běn)转语音实现(xiàn)实时语音(yīn)对话;英伟(wěi)达Omniverse Audio2Face,用于(yú)即时创建游戏角色表情动画(huà),以匹配任何语音轨(guǐ)道。

  开发人员可选择集成整(zhěng)个(gè)NVIDIA ACE for Games解决方案,也可仅使用需要的组件(jiàn)。

  新(xīn)参考工作(zuò)流程:帮助建设数字化智(zhì)能工厂

  黄仁勋表示,全球电子(zi)制造商正在使用(yòng)一种全(quán)新的综(zōng)合(hé)参(cān)考(kǎo)工作(zuò)流(liú)程推(tuī)进(jìn)工(gōng)业数(shù)字(zì)化工作,该工作流程结合了英伟达用于生成式AI、3D协(xié)作、仿(fǎng)真和自主机器的技术(shù),包括:

  英伟达Omniverse,其连接了顶级计算机(jī)辅(fǔ)助设(shè)计应用以及生成(chéng)错一个题就往阴里装一支笔式(shì)AI的API和前(qián)沿框架;用于(yú)模(mó)拟和(hé)测试机器人的英伟(wěi)达Isaac Sim应用程序;英伟达Metropolis视(shì)觉AI框架,用于自(zì)动光学检(jiǎn)测。

  同时,黄(huáng)仁勋现场展示了一个完(wán)全数字化的智能(néng)工厂的演示。

  目(mù)前富(fù)士康工业(yè)互联(lián)网、宜鼎国际、和硕(shuò)、广达和纬(wěi)创正(zhèng)在使用这一参考工作流程,具体用(yòng)例包(bāo)括电路板质保检(jiǎn)测点自动化、光学检测自动化、建设虚拟工(gōng)厂、模拟协作(zuò)机器人、构(gòu)建及运营(yíng)数字(zì)孪生(shēng)等。

  MGX服务器规范:快速高(gāo)效构(gòu)建百余种服(fú)务器(qì)配置

  英伟达发布NVIDIA MGX服务器规(guī)范,为系统制造(zào)商(shāng)提供模块化参考架构,满足(zú)各种规模的数(shù)据中心(xīn)需求。系统制(zhì)造商可(kě)使用它快速且经济(jì)高效地构(gòu)建100多种服务器配置,以适应广泛(fàn)的AI、HPC及NVIDIA Omniverse应用(yòng)。

  MGX支持(chí)英伟达全系列GPU、CPU、DPU和网(wǎng)络适(shì)配器(qì)、各种x86、完整(zhěng)软件(jiàn)堆栈及Arm处理器(qì),还(hái)可集成到云(yún)和企业数据中心中。

  华(huá)硕、和硕、QCT、超微(wēi)(Supermicro)等(děng)都将(jiāng)采用MGX构建下一代加(jiā)速(sù)计算机,可将开发成本削减多达3/4,并(bìng)将开发时(shí)间缩短2/3至(zhì)仅需6个(gè)月

  其中,QCT和超微基于MGX的设计将于8月面世错一个题就往阴里装一支笔。超微昨日(rì)公(gōng)布(bù)的ARS-221GL-NR系统将采用Grace CPU,而QCT的S74G-2U系(xì)统将采(cǎi)用(yòng)Grace Hopper。

  推出Spectrum-X网络平(píng)台 构建超(chāo)大规(guī)模生成式(shì)AI超级(jí)计(jì)算(suàn)机Israel-1

  另外,黄仁勋宣布推出NVIDIA Spectrum-X网络平台,旨在提高(gāo)基于以太(tài)网(wǎng)的(de)AI云的性能(néng)和效率。

  相比(bǐ)传统(tǒng)以太网结构,Spectrum-X可(kě)实现1.7倍(bèi)的整(zhěng)体(tǐ)AI性能和(hé)能效提升,并具有(yǒu)高度通(tōng)用性,可用(yòng)于各(gè)种AI应(yīng)用。它使用完(wán)全基于标准的以太网,并可与基于(yú)以太网的(de)堆栈(zhàn)互操作。该平台(tái)支持256个200Gb/s端口,通(tōng)过单个交换(huàn)机连接,或在两(liǎng)层leaf-spine拓扑(pū)中提供16000个端口(kǒu),以(yǐ)支持AI云增(zēng)长和扩(kuò)展,在保持性能的同时最(zuì)大限度减少(shǎo)网络(luò)延迟。

  全球领先云计算提供商正在(zài)采用Spectrum-X平(píng)台扩展(zhǎn)生(shēng)成式AI服(fú)务(wù),而(ér)Spectrum-X、Spectrum-4交(jiāo)换机、BlueField-3 DPU等已在戴尔、联想等(děng)系(xì)统制(zhì)造商(shāng)处(chù)提供。

  此外(wài),作为Spectrum-X参考设计的蓝图和测(cè)试平台,英伟达正构建(jiàn)一台超大规模生成式AI超(chāo)级计算(suàn)机Israel-1。这台AI超算(suàn)价值数亿美元,将采用(yòng)戴尔PowerEdge XE9680服务器、英伟达HGX H100超级计算平(píng)台、内置BlueField-3 DPU和(hé)Spectrum-4交换机的Spectrum-X平台(tái)。

  结语

  “40年来,我们创造(zào)了(le)PC、互联网、移(yí)动、云,现在(zài)是人工智(zhì)能时代。你(nǐ)会创造什么(me)?不管(guǎn)是什(shén)么,都要像(xiàng)我们(men)一样追赶它。要奔跑,不(bù)要走。要么(me)为了食物奔跑,要(yào)么作为食(shí)物(wù)奔跑(pǎo)。”

  在(zài)5月27日的(de)台(tái)湾大学发(fā)表(biǎo)了(le)毕业典礼演讲上,黄仁(rén)勋再次(cì)强(qiáng)调了掌握AI技术的(de)重要(yào)性:很多(duō)人担心,AI会抢(qiǎng)走自(zì)己(jǐ)的工作。但真正(zhèng)会(huì)抢走你饭碗的(de),是掌握了AI技术的人。

  他表示,从(cóng)各方面来看,AI的兴(xīng)盛是计算机产业(yè)的再生契机。在下个十年(nián),我们的产业将使用新(xīn)型AI电脑,取代价值万亿美元的传统电脑。

  而从昨日大会上黄仁勋的展示中,人工(gōng)智能时代(dài)的未来轮廓似乎已逐渐(jiàn)浮现。

未经允许不得转载:橘子百科-橘子都知道 错一个题就往阴里装一支笔

评论

5+2=