国产久操视频-国产久草视频-国产久热精品-国产久热香蕉在线观看-青青青青娱乐-青青青青在线成人视99

  • 正文
  • 相關推薦
申請入駐 產業(yè)圖譜

GTC 2025:黃仁勛拉開AI新紀元大幕

03/21 15:07
1337
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

“獨家前線報道!CDCC專家團隊親臨GTC 2025大會現場,為您揭開這場科技盛會的神秘面紗。他們將以專業(yè)的洞察力和獨到的見解,深入解讀GTC 2025上的創(chuàng)新技術和未來趨勢。

AI 界 “超級碗” 來襲

在科技飛速發(fā)展的今天,人工智能(AI)領域的每一次重大突破都備受矚目。而英偉達的GTC大會,堪稱 AI 界的 “超級碗”,每一屆都吸引著全球目光,匯聚前沿技術,帶來行業(yè)震撼。

今年,英偉達創(chuàng)始人兼CEO黃仁勛再次以標志性的皮衣造型登場,為我們帶來一場持續(xù)超兩小時的技術盛宴,其中的重磅發(fā)布更是讓整個科技圈為之沸騰。接下來,就讓我們一同深入這場盛會,看看黃仁勛究竟帶來了哪些令人驚嘆的內容。

Blackwell Ultra?GPU

在本次GTC大會上,英偉達推出的Blackwell Ultra芯片無疑是硬件領域的一大亮點。

Blackwell Ultra由兩顆臺積電N4P(隸屬于5nm家族的4nm加強版)工藝Blackwell GPU+Grace CPU+更大容量的HBM封裝而來,即搭配了更先進的12層堆疊的HBM3e,顯存容量提升至為288GB,和上一代一樣支持第五代NVLink,可實現1.8TB/s的片間互聯(lián)帶寬。

數據中心的實際應用為例,Blackwell Ultra芯片的AI性能是前代的1.5倍,這意味著在處理復雜的AI模型訓練和推理任務時,能夠更加高效地完成工作。同時,該芯片在能效方面也進行了優(yōu)化,全面改用液冷散熱,硬剛1.4KW功耗。

Blackwell Ultra芯片的推出,標志著AI計算焦點從大模型預訓練向深度推理與復雜推理的轉變,將為數據中心、企業(yè)AI工廠及自動駕駛機器人等領域提供強勁的計算能力。

然而,頂級配置的GB300服務器價格突破300萬美元(約合人民幣2000萬)!不過,亞馬遜、微軟等云巨頭已火速下單,畢竟AI軍備競賽里,“貴”是你的問題,不是他的問題。

Blackwell Ultra NVL72:AI推理專用機柜

和GB200 NVL72一樣,英偉達今年也推出了類似的產品Blackwell Ultra NVL72機柜,一共由18個計算托盤構成,每個計算托盤包含4顆Blackwell Ultra GPU+2顆Grace CPU,總計也就是72顆Blackwell Ultra GPU+36顆Grace CPU,顯存達到20TB,總帶寬576TB/s,外加9個NVLink交換機托盤(18顆NVLink 交換機芯片),節(jié)點間NVLink帶寬130TB/s。

機柜內置72張CX-8網卡,提供14.4TB/s帶寬,Quantum-X800 InfiniBand和Spectrum-X 800G以太網卡則可以降低延遲和抖動,支持大規(guī)模AI集群。此外,機架還整合了18張用于增強多租戶網絡、安全性和數據加速BlueField-3 DPU。

英偉達說這款產品是“為AI推理時代”專門定制,應用場景包括推理型AI、Agent以及物理AI(用于機器人、智駕訓練用的數據仿真合成),相比前一代產品GB200 NVL72的AI性能提升了1.5倍,而相比Hopper架構同定位的DGX機柜產品,可以為數據中心提供50倍增收的機會。

根據官方提供的信息,6710億參數DeepSeek-R1的推理,基于H100產品可實現每秒100tokens,而采用Blackwell Ultra NVL72方案,可以達到每秒1000 tokens。換算成時間,同樣的推理任務,H100需要跑1.5分鐘,而Blackwell Ultra NVL72 15秒即可跑完。


Blackwell Ultra NVL72和GB200 NVL72硬件參數

Vera Rubin

繼Blackwell之后,Nvidia計劃將于2026年下半年推出Vera Rubin(包含Vera Arm CPU + Rubin GPU) ,2027年下半年推出Rubin Ultra NVL576,2028年推出搭配Feynman GPU架構的產品。

Vera是Nvidia的首款定制CPU設計。Nvidia表示,Vera將比去年的Grace Blackwell芯片中使用的CPU快兩倍。與Vera搭配使用,Rubin可以在進行推理時實現每秒50 petaflops,比目前Blackwell芯片每秒20 petaflops的速度高出一倍多。Rubin還可以支持高達 288GB HBM4內存。

Nvidia還對其GPU進行了更改。Nvidia表示,Rubin實際上是兩個GPU。2027年下半年,Nvidia計劃發(fā)布一款“Rubin Next”芯片,該芯片將四個芯片組合成一個芯片,使Rubin的速度翻倍。這款產品將搭載在一款名為Vera Rubin NVL144的機架上。NVIDIA在談論 NVLink域時計算的是GPU裸片,而不是單個GPU芯片。因此NVL144是144個裸片,而不是144個芯片。

Rubin Ultra NVL576每機架600KW,FP4峰值推理算力高達15 EFLOPS,FP8訓練算力達到5EFLOPS。每個GPU封裝1TB HBM4e內存。Nvidia稱其性能是今年推出的 Blackwell Ultra機架的14倍。

RTX PRO Blackwell 系列

英偉達還發(fā)布了RTX PRO Blackwell系列工作站和服務器GPU,這一系列產品通過突破性的加速計算、AI 推理、光線追蹤和神經渲染技術,重新定義了AI、技術、創(chuàng)意、工程和設計專業(yè)人士的工作流。

其中,旗艦級的RTX PRO 6000系列擁有24,064個CUDA核心、752個Tensor核心188個RT核心。

RTX PRO 6000全系均配備96GB GDDR7顯存(支持 ECC 校驗),具備512 bit顯存位寬,這意味著GPU板正反兩面都使用了3GB GDDR7顯存模塊。

英偉達共發(fā)布12款同架構產品,包含雙風扇設計(最高 600W TDP)的工作站版、渦輪鼓風式設計的集群工作站版,以及服務器專用版。

數據中心

NVIDIA RTX PRO 6000 Blackwell 服務器版

桌面平臺

  • NVIDIA RTX PRO 6000 Blackwell 工作站版
  • NVIDIA RTX PRO 6000 Blackwell Max-Q 工作站版
  • NVIDIA RTX PRO 5000 Blackwell
  • NVIDIA RTX PRO 4500 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell

移動平臺

  • NVIDIA RTX PRO 5000 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell
  • NVIDIA RTX PRO 3000 Blackwell
  • NVIDIA RTX PRO 2000 Blackwell
  • NVIDIA RTX PRO 1000 Blackwell
  • NVIDIA RTX PRO 500 Blackwell

在AI領域,該系列GPU能夠加速AI模型的訓練和推理過程,使得研究人員能夠更快地驗證和優(yōu)化模型,推動AI技術的發(fā)展。

DGX Spark 和 DGX Station

為了讓AI開發(fā)更加普及,英偉達發(fā)布了由NVIDIA Grace Blackwell平臺驅動的DGX Spark和DGX Station個人AI超級計算機。

DGX Spark體積小巧,尺寸類似Mac Mini,采用標準電源供電,起售價僅為3000美元,大大降低了AI開發(fā)的門檻。它搭載了新一代NVIDIA Blackwell Ultra平臺,在FP4計算精度下可提供1 PFLOPS的AI性能,支持本地運行高達2000億參數的 AI 模型。若將兩臺設備互聯(lián),更可擴展至4050億參數模型的訓練與推理。

DGX Station則是一款面向更廣泛領域的大型桌面級AI計算中心,內部搭載強大GB300 Blackwell Ultra、784GB統(tǒng)一系統(tǒng)內存、內置800Gbps Nvidia網絡,以及承諾的20 petaflops AI性能,據稱將由華碩、戴爾、惠普等公司生產。

NVIDIA Isaac GR00T N1

英偉達宣布與DeepMind、迪士尼合作,開發(fā)機器人模擬的開源物理引擎Newton,并展示了搭載GR00T N1的人形機器人“Blue”。

黃仁勛在現場演示中強調,通用機器人時代已經來臨。相比傳統(tǒng)的工業(yè)機器人,通用機器人能夠適應不同環(huán)境,具備更強的自主學習能力。AI不再局限于計算機系統(tǒng),而是開始走入物理世界,成為可以執(zhí)行任務的智能體。

Spectrum-X Photonics硅光網絡交換機

隨著AI工廠規(guī)模的不斷擴大,對網絡基礎設施的要求也越來越高。在本次GTC大會上,英偉達推出的Spectrum-X Photonics硅光網絡交換機,為AI工廠的網絡連接帶來了革命性的解決方案。

這款交換機創(chuàng)新地集成了光器件,采用了全球首創(chuàng)的200Gb/s光電一體化封裝方案,將外部數字信號處理單元、1.6Tb/s交換ASIC與收發(fā)器高度集成,徹底重構了傳統(tǒng)可插拔交換機的設計邏輯。通過優(yōu)化信號傳輸路徑,Spectrum-X Photonics將信號完整性提升了 63 倍,傳統(tǒng)架構因連接器、PCB等介質導致22dB電氣信號損失,而光電一體化封裝光學方案僅產生4dB損耗。

在能耗方面,Spectrum-X Photonics表現出色。它減少了4倍的激光器數量,與傳統(tǒng)方法相比,能源效率提高到3.5倍。在信號傳輸的可靠性上,大規(guī)模組網可靠性提高到10倍,部署速度提高到1.3倍,為AI工廠的穩(wěn)定運行提供了有力保障。

Spectrum-X Photonics交換機具有多種配置,包括128個800 Gb/s端口或512個200Gb/s端口,總帶寬可達到100Tb/s,以及512個800 Gb/s 或2,048個200 Gb/s端口,總吞吐量可達400Tb/s,能夠滿足不同規(guī)模AI工廠的網絡需求。

軟件開源

除了硬件,英偉達這次在軟件開源方面也有幾個新動作。

其中最重磅的,當屬發(fā)布NVIDIA Dyamo,一個用于加速AI模型推理的分布式推理服務庫。

老黃將其稱為“AI工廠的操作系統(tǒng)”,核心目標在于提高推理性能的同時降低Test-Time算力消耗。按照英偉達的說法,在NVIDIA Blackwell上使用Dynamo優(yōu)化推理,能讓DeepSeek-R1的吞吐量提升30倍。

至于背后原因,主要在于Dynamo可以通過動態(tài)調整GPU資源應對請求波動,并優(yōu)化數據卸載到成本更低的存儲設備,從而降低推理成本并提高效率。

目前Dynamo已完全開源,支持PyTorch、SGLang、NVIDIA TensorRTyTM以及vLLM,在GitHub獲取后即可將推理工作分配到多達1000個NVIDIA GPU芯片。

此外,英偉達還宣布開源新的AI推理模型——Llama Nemotron,該系列模型也曾出現在今年1月的CES上。

據介紹,Llama Nemotron基于開源Llama基礎模型構建,采用英偉達最新技術和高質量數據集進行剪枝和訓練,優(yōu)化了計算效率和準確性。

行業(yè)合作新進展

英偉達一直注重與各行業(yè)企業(yè)的合作,通過合作推動AI技術在各個領域的應用和發(fā)展。在本次GTC大會上,英偉達也宣布了一系列與行業(yè)企業(yè)的合作成果。

英偉達與Ansys、Altair、Cadence、Siemens 和 Synopsys等在內的領先計算機輔助工程(CAE)軟件供應商合作,使用NVIDIA Blackwell平臺加速其仿真工具,速度提升高達50倍。這將有助于汽車、航空航天、能源、制造業(yè)和生命科學等行業(yè)在保持能效的同時,大幅縮短產品開發(fā)時間、降低成本并提高設計精度。

在汽車領域,英偉達與通用汽車合作,共同利用NVIDIA加速計算平臺構建定制化AI系統(tǒng),訓練AI制造模型,優(yōu)化通用汽車的工廠規(guī)劃和機器人開發(fā)。通用汽車還將使用NVIDIA DRIVE AGX車載硬件,打造未來的高級駕駛輔助系統(tǒng)和車內增強型安全駕駛體驗。

在醫(yī)療領域,英偉達與GE醫(yī)療合作,共同推進自主成像技術創(chuàng)新,重點開發(fā)自主X射線技術與超聲應用。

在電信領域,英偉達與T-Mobile、MITRE、思科、Cerberus Capital Management 旗下公司ODC,以及Booz Allen Hamilton達成合作,共同研發(fā)AI原生6G無線網絡硬件、軟件及架構。為了無縫鏈接數千億部手機、傳感器、攝像頭、機器人和自動駕駛車輛,下一代無線網絡必須從根本上與AI深度融合。AI原生無線網絡不僅能夠為數十億用戶帶來更優(yōu)質的服務,還將在頻譜效率(即單位帶寬內的數據傳輸速率)方面樹立全新標準。

本次GTC大會,英偉達在黃仁勛的帶領下,展現出了強大的技術實力和創(chuàng)新能力。從硬件到軟件,從模型到網絡,英偉達的每一項發(fā)布都為AI的發(fā)展注入了新的活力。

未來,隨著這些技術的不斷應用和推廣,AI將在更多領域實現突破,為我們的生活和工作帶來更多的便利和創(chuàng)新。

尾記

在英偉達全球技術大會(NVIDIA GTC)的活動現場,康普隆重推出其最新創(chuàng)新成果 ——Propel XFrame? 。作為Propel?高性能數據中心解決方案組合的最新成員,Propel XFrame解決方案是一款落地式光纖配線架光纖配線機架,旨在支持并滿足數據中心和高性能計算設施當下和未來的需求。這一簡潔且高效的解決方案能夠實現高密度光纖連接的更快速、更靈活的部署與管理,同時還能優(yōu)化您的空間和內部資源。

Propel XFrame解決方案亮點:

通過緊湊的外形設計和多種部署配置,優(yōu)化數據中心空間利用。

通過支持多類標準化連接器的配線機架,最大限度地利用Propel組件和配線架,從而為數據中心管理者提供更多選擇。

通過前端訪問所有配線架,有望降低人工成本。此外,水平和垂直電纜管理可使布線保持有序,從而實現更快速、更準確的移動、添加和更改操作。

有關 Propel XFrame解決方案的更多信息(包括規(guī)格),請點擊閱讀原文訪問官方網站。

英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。收起

查看更多

相關推薦

苏尼特右旗| 宕昌县| 阿城市| 张家港市| 绥江县| 芒康县| 东城区| 眉山市| 安岳县| 青州市| 西充县| 聊城市| 栾城县| 河西区| 南充市| 沧源| 兴安盟| 眉山市| 松溪县| 德化县| 泸水县| 阿拉善盟| 藁城市| 张掖市| 勃利县| 太仆寺旗| 东阳市| 三原县| 西林县| 桦甸市| 昆明市| 普洱| 静安区| 乐山市| 凌海市| 永宁县| 格尔木市| 明光市| 尤溪县| 秭归县| 贵定县|