最適合人工智慧的桌面超級計算機

  • DGX Spark 將 1 petaFLOPS 和 AI 堆疊帶到桌面,並具有本地安全性。
  • 歐洲正在推動 EuroHPC(MareNostrum 5、Leonardo、LUMI)以及 HPC-6 和 ALPES 等中心的發展。
  • 美國、中國、日本和印度則以 Aurora、El Capitan 和天河三號引領百億億次運算領域。
  • 該生態系統結合了大規模 HPC 和本地團隊進行開發、微調和推理。

超級計算機

個人電腦和資料中心之間的界線正在迅速模糊,隨之而來的是一個新的類別: 用於人工智慧的桌面超級計算機這一飛躍不僅使大規模計算的訪問變得民主化,也改變了我們原型設計、訓練和推斷高級模型的方式,而不必總是依賴 .

與此同時,地球正在經歷一場真正的百億億次計算競賽,從 數百兆瓦的國家基礎設施 甚至研究人員辦公室裡那些能夠達到每秒千萬億次浮點運算速度的緊湊型計算機。在本文中,我們將所有參考資料的關鍵數據匯總到一起:全球概覽、歐洲和亞洲的玩家、歷史榜單、領先的計算中心,當然還有桌面領域的新星——Nvidia DGX Spark。

什麼是超級電腦?為什麼它在人工智慧中很重要?

Un 超電腦 該系統的運算能力遠超傳統PC。其效能以FLOPS(每秒浮點運算次數)表示,例如petaFLOPS(1015),在目前的精英層級中,exaFLOPS (1018).

它們由數千個節點組成(每個節點都有 CPU、 專用 GPU、內存和存儲)透過 高速網路和交換機,可以作為單機運作。雖然功能強大的桌上型電腦可以運行數十 TFLOPS,但這些系統可以達到數百 PFLOPS 甚至更高。

它的應用幾乎涵蓋了一切: 天氣預報、天文物理學、生物醫學、藥物設計、核模擬、地球物理、永續性和人工智慧研究。由於大量計算,它們可以在幾秒鐘內處理數十億個數據點,並解決傳統設備需要數年時間才能解決的問題。

  • 特色用途: 武器和國家安全、製藥業、大數據、生物資訊學、氣候和空氣品質、工程模擬、智慧城市、教育和雲端運算。

由於其尺寸和消耗量,它們需要 先進的冷卻方式(通常為液體)以及配備溫控和防火設施的專用房間。甚至還有一些中心會重複利用產生的熱量,例如瑞士大學建築的暖氣設施。

歐洲加速發展:EuroHPC、InvestAI 與大型系統

歐洲超級運算和 EuroHPC

歐洲有 2025年將報名162台超級計算機 並規劃新設施。歐盟也在InvestAI計畫下推動了200.000億歐元的投資,以成為人工智慧領域的全球領導者。

高階計算的協調和融資落到了“歐洲高效能運算合資企業» (EuroHPC JU),該組織贊助並經營遍布歐洲大陸的9個系統網絡。這些系統包括LUMI(芬蘭)、Leonardo(義大利)和MareNostrum 5(西班牙),它們是 歐洲數字主權.

西班牙貢獻 巴塞隆納超級計算中心(BSC-CNS)該公司於 2004 年建造了具有歷史意義的 MareNostrum 1 號,並於 2023 年 12 月推出了 MareNostrum 5 號。後者 最大 314 PFLOPS,英特爾至強處理器,功耗為 4.158,90 kW,將在 2025 年佔據 TOP500 的第 11 位,面向人工智慧、醫學研究、藥物發現和氣象學。

義大利閃耀著 萊昂納多 (Cineca + EuroHPC),於2022年在博洛尼亞安裝。它結合了AMD和Intel技術,功耗為7.493,74千瓦,達到 315,74 浮點數 在全球排名第九。對於大學和企業而言,在生物醫學、能源、氣候以及最重要的人工智慧領域參與全球競爭至關重要。

芬蘭主辦 盧米 (CSC + EuroHPC),由 AMD 和 HPE 提供支援。它於 2023 年在卡亞尼啟用,預計將達到 386 浮點數,功耗為7.106,82千瓦,位居全球第八。在歐洲高效能運算聯盟(EuroHPC)中,它是最強大的堡壘之一。

同時,瑞士在 CSCS 運行超級計算機 阿爾卑斯/阿爾卑斯 5,其消耗功率為 7.124,00 千瓦, 434,90 浮點數 排名世界第七。它專注於 氣象學、人工智慧、生物醫藥和能源,並且是 13 個專案計劃的一部分,其中 ALPES 是最具代表性的專案。

能源產業也在推動:義大利埃尼集團於 2024 年啟動 高性能計算-6 與 AMD 和 HPE 合作,實現 606,97 浮點數 耗電量為8.460,90千瓦。它與ENI的綠色資料中心相連,以加速能源轉型,在全球排名第五。

亞洲和美洲:百億億次級運算、記錄和影子系統

日本保持卓越的象徵 Fugaku (RIKEN R-CCS,神戶)。基於富士通 A64FX 和 ARM 架構,實現了 442 浮點數 26.248,36 千瓦,並繼續成為其效率的標桿,領先於 Green500 根據所查閱的資料。它適用於醫學、氣候、人工智慧和能源效率。

儘管受到製裁,俄羅斯仍在 2023 年部署了 密歇根州立大學-270 在莫斯科羅蒙諾索夫國立大學研發。它整合了大約 100 個尖端圖形加速器(目前尚不清楚它們來自 AMD 還是英特爾),估計 400 浮點數,融入俄羅斯人工智慧、物理、化學、數學和醫學中心網路。

中國既謹慎又有實力。該系列 雙威 無錫太湖之光(TaihuLight)於2016年誕生,其運算能力達125 PFLOPS。 2021年,其發展成果為OceanLight,其運算能力達百億億次級(>1 exaFLOPS),但由於與美國的技術緊張關係,官方並未公佈其實際運算能力。 2024/2025年, 天河三號(興義號) 在測試中,它達到了 1,57 到 2,01 exaFLOPS 之間的速度,有傳言稱其能夠超越 El Capitan。

美國憑藉數個百億億次級模型躋身「大聯盟」。 極光 (ANL + DOE),設計速度達到 1,9–2 exaFLOPS,於 2023 年安裝,並於 2024 年達到峰值;目前它在 TOP500 中排名第三,並服務於 科學、醫學、氣候、人工智慧、天文物理學和粒子物理學。並聯, 隊長 (LLNL + NNSA)的目標是 2-2,8 exaFLOPS,領先 TOP500,並將致力於國家安全,應用於核模擬、網路安全、醫療保健、氣候變遷和天文物理學。

除了公開的清單之外,國家層級也有一些具體的人工智慧措施。在武漢, 中國電信營運中央智慧運算中心採用國產硬體和軟體以及液體冷卻技術,用於訓練巨型模型;一些消息來源甚至指出 5 億次浮點運算,但尚未得到官方證實。

印度正在崛起:GPU、雲端運算和百億億次運算

印度不想落後。該倡議 印度人工智慧運算能力 (在印度人工智慧計畫框架內)承諾在2024年投入約1.240億美元,與英偉達合作,打造一台至少配備10.000個用於人工智慧的GPU的新型超級電腦。此外, 微軟宣布斥資 3.000 億美元 2025年1月,該國將建成雲端運算和人工智慧基礎設施。

當地生態系統正在升溫: 巴維什·阿格瓦爾(Bhavish Aggarwal) (Ola 執行長)向 Krutrim-2 法學碩士課程投資了 230 億美元。 34台超級計算機印度國家超級運算中心 (C-DAC) 正與國家超級運算任務 (NSM) 共同推動建立全國性網絡,預計在 2025 年至 2026 年間交付印度首個百億億次級系統。計劃建設 超過 70 台超級計算機 在接下來的幾年裡。

Colossus、xAI 的超級電腦和能源爭議

在美國, xAI(Elon Musk)部署了 Colossus 2024年,這家公司在孟菲斯僅用122天就完成了研發。該公司最初部署了100.000萬塊英偉達GPU,並計劃增加到200.000萬塊,目標是Grok 3.0 AI及未來版本。在基準測試中,它達到了 10,6 exaFLOPS 的人工智慧,這一數字將使該國成為地球上最強大的國家之一。

並非所有事情都是掌聲: 天然氣作為能源 該項目因其對當地空氣品質的影響而受到批評。儘管如此,該計畫仍展現了私營部門建設世界一流人工智慧基礎設施的速度。

DGX Spark:將先進人工智慧帶回家的“桌上超級電腦”

Nvidia 設定了高標準 DGX Spark,這是一款緊湊型系統,被《時代》雜誌評為“2025 年最佳發明”之一,並於 10 月 15 日起向公眾發售。其核心是 格蕾絲·布萊克威爾 GB10,能夠達到 1 petaFLOPS,配備 ConnectX-7 網路和整個 Nvidia AI 軟體堆疊,以便研究人員和新創公司可以「即插即用」地使用它。

在硬體層面,Spark 結合了 20核心ARM CPU (10 Cortex-X925 + 10 Cortex-A725)、128GB LPDDR5x 統一 GPU 記憶體、4TB 自加密 M.2 NVMe SSD、4x USB-C、HDMI、WiFi 7、藍牙 5.4、10GbE LAN 和系統 DGX作業系統。它是為代理人工智慧、推理和現代複雜有效載荷而設計的。

Nvidia 堅持他們可以 擬合具有高達 70.000 億個參數的模型運行本地推理,並將敏感資料保存在本地,無需依賴雲端。其他報告表明,它可以處理高達 200.000億個參數 根據配置和型號,強調其作為桌面「微型資料中心」的雄心壯志。

在功能方面, 連結兩個火花 在迷你集群中建立一個「個人雲端」。它的整合很簡單:有線和無線網路、藍牙週邊和堆疊 CUDA/cuDNN、Triton 和公司部署 代理原型、微調、隔離推理和資料安全.

起標價定為 美元3.999以及宏碁、華碩、戴爾、技嘉、惠普、聯想和微星等主要品牌都將推出不同版本。重要提示:這不是一台典型的 Windows PC;它是 用於人工智慧的本地超級計算機 相容以下型號 DeepSeek,中國人工智慧Meta、Nvidia、Google 和 Qwen 等眾多開源應用程式。就連伊隆馬斯克也已經從黃仁勳手中獲得了他的裝備。

Spark 的到來恰逢優先事項的改變:據行業領袖稱, 用戶和企業將尋找支援下一波智慧充電的系統。訂單可在 Nvidia.com 以及透過授權合作夥伴和經銷商進行。

AI PC 和工作站:當你需要特定硬體時

最適合人工智慧的桌面超級計算機

如果你要訓練模型或開發,建議 投資專用硬體;如果你只消耗AI,一個平衡的團隊可能就足夠了,或者訴諸 EC2 執行個體 在雲端

此外,有些團隊無需依賴雲端,就能將強大的人工智慧引入本地市場,就像我們在 Spark 專案中看到的那樣。如果你不確定該如何選擇,有些團隊還提供個人化支援: 伊比利亞貴賓 承諾為您提供建議 選擇理想的電腦 適用於您的 AI 項目。

社群與新聞:你所讀到的並非都是官方的

網路上充斥著 Nvidia 相關的論壇和子版塊,人們在其中討論驅動程式、GPU 和各種傳聞。注意: 這些社群由粉絲管理 除非另有說明,否則不代表 Nvidia。在評估洩漏資料或未經證實的資料時,請務必牢記這一點。

它們的內部結構:架構、擴展和冷卻

超級電腦本質上是一組由數千台電腦連接而成的 低延遲、高頻寬網絡每個節點整合了 CPU、GPU、RAM 和儲存;系統透過最佳化的軟體和庫增強了功能。

目前最主要的指標是 FLOPS:我們從家用電腦的 TFLOPS 提升到了 PFLOPS 和 exaFLOPS 在 HPC 中。因此,1 TFLOPS = 1012 FLOPS 和 1 PFLOPS = 1015超級電腦佔據了整個房間,並由多個團隊同時使用,資源通常已經達到極限。

冷卻至關重要。有些 CPU 和 GPU 的散熱效能超過了 80 攝氏度這就是為什麼要使用調溫水或液態水、熱交換器和客製化設計的原因。有些裝置採用了富有創意的解決方案,例如 再利用熱量 用於建築物加熱。

它們在哪裡以及如何參觀它們

世界上有超過一千台超級電腦。 中國和美國領先 在數量和性能上,中國在500強中佔據絕對優勢。歷史數據顯示,中國有226個系統躋身前500名。然而,在某些版本中,美國累積的每秒浮點運算次數(PFLOPS)(644)超過了中國(565)。

在西班牙, 計算機MareNostrum BSC-CNS(巴塞隆納)是西班牙最強大的機構。其最初的版本被安置在一個玻璃櫃中, 微霧滅火系統 以及一個獨特的地點:UPC北校區的教堂。學校提供虛擬參觀,有時還提供導覽服務。

歷史文獻記載了 馬諾斯特姆 5 2020年至2021年間;最終於2023年底推出,並實現了上述性能提升。這一演變清楚地表明了 HPC 中的日曆 由於技術複雜性而進行調整。

歷史列表和其他特色系統

清單 TOP500 該排名自1993年以來一直存在,每年更新兩次。例如,2021年,前十名的火箭包括富嶽火箭、頂峰火箭、塞拉火箭、神威太湖之光火箭、珀爾馬特火箭、塞勒涅火箭、天河二號A火箭、朱維爾斯助推器模組火箭、高性能計算五號火箭和弗龍特拉火箭。儘管其中一些火箭已被超越,但它們仍然 技術里程碑 因為它的影響。

來源中引用的系統的一些額外相關數據: 邊疆 (HPE Cray EX、ORNL)是第一台正式突破百億億次級運算能力的電腦; Summit (IBM POWER9 + Nvidia V100)在阿茲海默症、遺傳學和氣象學方面表現出色; 內華達 (IBM + Nvidia + Mellanox)為 NNSA 從事核安工作。

在歐洲,除了已經提到的之外,還有 珠寶助推器 y 超級MUC (聯想,直接水冷),擁有數十PB的數據和強大的視覺化環境。瑞士營運 皮茲·丹特 (Cray),使用 DataWarp 作為突發緩衝區來加速 I/O。

義大利註冊成立 HPC5 (戴爾,在 ENI 上)配備 Xeon Gold 6252 和 Nvidia V100; 馬可尼100 (IBM POWER9 + Volta V100)在 Cineca;以及 珀爾姆特(Perlmutter) (美國柏克萊實驗室)是 人工智慧處理 配備 6.000 個 A100 GPU,能夠實現 180 PFLOPS,在某些 AI 場景中,能夠實現數個有效的 exaFLOPS。

在美國, 塞勒涅 (Nvidia,A100)效率最高(1.344 kW); 特拉 (戴爾,德克薩斯大學)因其存儲(50 PB HDD + 3 PB SSD,12 Tbps)和 17 秒內重啟而脫穎而出; 英語會話 (Cray XC40)與 Haswell 和 Knights Landing 一起為 NNSA 服務; (IBM Power9)加強了 LLNL 生態系統。

日本也推行 農行指數 (富士通)在雲端人工智慧方面。在西班牙, 馬諾斯特姆 4 (2017) 在躍升至 MN5 之前已達到 13,7 PFLOPS,可應用於遺傳學、化學、古生物學、氣象學或空氣品質(CALIOPE)。

這張從百億億次電腦到桌面的完整地圖描繪了不久的將來 測試、調整和推斷高級模型將越來越本地化並以雲端運算作為補充。歐洲正憑藉 EuroHPC 加速發展,美國和中國正緊跟百億億次運算的步伐,印度正憑藉大規模投資崛起,而在桌面端,DGX Spark 正在為高級人工智慧打開一扇切實的大門,讓人們無需離開實驗室、辦公室,甚至無需離開家即可體驗。

什麼是 Microsoft Azure?
相關文章:
Microsoft Azure:它是什麼、如何運作以及其所有產品和服務