如果您知道在哪裡安裝 CUDA 以及要匹配哪些版本,那麼在 Windows 上安裝 CUDA 並不是一件麻煩事。在本實用指南中,我將逐步指導您如何在原生 Windows 和 WSL 上啟動並執行該工具包、正確的驅動程式和驗證實用程式。目標是徹底摧毀您的 GPU。 真正加速 您的工作負載,而不會出現相容性問題。
除了基本安裝之外,我還將介紹實際用例和特殊要求(例如具有遺留依賴項的 ML.NET 模型建構器)、使用 Conda 和 pip 的安裝替代方案、與 Visual Studio 的整合以及經典的 deviceQuery 和 bandwidthTest 測試。您還將了解如何診斷 典型的駕駛員問題、GPU 檢測和 CUDA 版本不匹配通常會在第一次降低人們的速度。
什麼是 CUDA?為什麼它在 Windows 上很重要?
CUDA 是 NVIDIA 編程 用於平行計算,允許你將應用程式中最密集的部分卸載到 GPU。 CPU 處理順序工作,GPU 處理 大規模平行,每個都有自己的內存,避免瓶頸並允許同時工作。
支援 CUDA 的 GPU 擁有數百或數千個核心,運行數萬個線程。諸如 cuBLAS、cuDNN 和 NVCC 完成該套件,以便您可以在 Windows 上編譯、偵錯和分析 GPU 加速軟體。
Windows 上的系統需求和相容性
首先,您需要檢查您的系統是否與所需的工具包相容。在目前的 Windows 系統上, CUDA 13.0 U1 支持:Windows 11 24H2、23H2、22H2-SV2;Windows 10 22H2;Windows Server 2022 和 2025。
支援的編譯器和 IDE:帶有 C++11/14/17/20 的 Visual Studio 2022 17.x (MSVC 193x) 和帶有 C++11/14/17 的 Visual Studio 2019 16.x (MSVC 192x)。 支援 VS2017 它在 CUDA 13.0 中被刪除,並且對於 VS2015,它自 CUDA 11.1 起已被棄用,因此請調整您的專案。
32 位元重要提示:自 CUDA 12.0 起,不再提供 32 位元工具鏈(無論是原生的還是跨平台的)。驅動程式將繼續在 GeForce 上執行 32 位元二進位檔案。 Ada 架構;Hopper 不再支援 32 位元。
建議硬體:NVIDIA GPU,其運算能力與您的版本相符(一般情況下,3.0 或更高版本;請參閱官方列表),足夠的內存,某些特定情況下要求更高。對於模型建構器(影像分類),至少 6 GB的VRAM 專用,而基本用途則至少需要 4 GB。
檢查您是否有相容的 GPU 以及您擁有的版本

若要在 Windows 中檢查您的 GPU 型號:設定 > 系統 > 顯示 > 進階設定。 您將在“顯示訊息”下看到品牌和型號,對於確認相容性非常有用。
您也可以使用任務管理器中的“效能”選項卡,然後選擇“GPU”面板來查看詳細資訊。如果沒有顯示,請打開 設備管理器 並查看顯示適配器;如果缺少 NVIDIA 驅動程序,請安裝它。
若要檢查 CUDA 安裝,請開啟 PowerShell 或 CMD 並執行 nvcc --version o nvcc -V.這將返回編譯器版本 全國風險控制委員會 安裝;如果沒有回應,則表示工具包 PATH 未配置或未正確安裝。
如果您需要更新驅動程序,GeForce Experience 會建議使用最新版本,或者您也可以從 NVIDIA 官方驅動程式網站下載。更新驅動程式通常可以解決問題。 工具包不相容 以及檢測失敗。
下載 NVIDIA CUDA 工具包:格式和完整性
前往 NVIDIA 官方 CUDA 下載頁面,選擇 Windows 系統。您可以選擇網頁安裝程式(先下載最少的軟體包,然後按需安裝)或完整安裝程式(包含所有內容)。完整安裝程式非常適合離線電腦或 企業部署.
下載後,最好驗證已發布的 MD5 校驗和,以確保檔案未損壞。如果哈希值不匹配, 再次下載 安裝程式並避免以後出現麻煩。
自 CUDA 13 起,NVIDIA 驅動程式不再包含在 Toolkit 中。請單獨安裝驅動程序,無需 NVIDIA 驅動程式頁面 然後是工具包;避免混合不相容的版本。
Windows 上的安裝:圖形、靜默與擷取模式
圖形安裝:運行安裝程式並依照步驟操作。選擇位置,接受許可證,然後選擇 組件 例如工具包、Nsight Compute/Systems 和範例。
靜默安裝:您可以使用以下方式啟動安裝程序 -s 靜默模式,並為特定子包新增參數。如果您不想自動重啟,請添加 -n 最後您就可以管理重啟了。
手動解壓縮:使用 7-Zip/WinZip,您可以解壓縮整個壓縮套件來檢查其內容。工具包位於資料夾中。 CUDA工具包 以及與其同名目錄中的 Visual Studio 整合;您在安裝程式的根目錄中看到的 .dll 和 .nvi 檔案本身並不是可安裝的檔案。
預設工具包路徑: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0. 安裝子包時 您可以只選擇您需要的內容(例如, nvcc_13.0 對於編譯器來說, cudart_13.0 對於運行時, cublas_13.0/cublas_dev_13.0, cufft_13.0, curand_13.0, cusolver_13.0, cusparse_13.0, nsight_compute_13.0, nsight_systems_13.0, nvrtc_13.0, nvdisasm_13.0, nvprune_13.0, opencl_13.0, sanitizer_13.0, thrust_13.0等)。 這樣可以減少佔用空間和安裝時間.
卸載:所有子包均可從「控制台」>「程式和功能」中移除。如果您想要重新安裝某個版本,此功能非常有用。 清潔 或改變沒有任何殘留的分支。
Windows 中的驅動程式模型:WDDM 與 TCC
在 Windows 10 及更高版本中,NVIDIA 驅動程式可以兩種模式運作:WDDM(用於顯示裝置)和 TCC(用於 Tesla 或某些 Titan 等運算 GPU)。您可以使用以下命令檢查和更改模式 nvidia-smi 在支援的卡上;大多數現代 GeForce 卡預設使用 WDDM。
驗證安裝:nvcc、範例和測試
使用以下方法檢查 NVCC 版本 nvcc -V。如果命令有效, 路徑 基本安裝已到位。
從 GitHub 克隆 CUDA 範例 nvidia/cuda-samples,編譯並運行它們 deviceQuery。它應該會檢測您的設備並返回 測試通過;如果沒有,請檢查驅動程式和硬體。
還運行 bandwidthTest 驗證主機設備頻寬。如果測試通過,通信 CPU-GPU 沒問題。此處的任何錯誤通常都指向驅動程式或 Toolkit 安裝。
與 Visual Studio 和專案基礎架構集成
這些範例和您的專案可以使用 VS 2019/2022 解決方案進行編譯。 NVIDIA 範本使用以下程式碼設定了一個 C++ 專案: 建構自訂 適合您版本的 CUDA(例如,CUDA 13.0 Runtime)。
工具包 .props 檔案:VS 2019 中有 props C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\MSBuild\Microsoft\VC\v160\BuildCustomizations 和 VS 2022 C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Microsoft\VC\v170\BuildCustomizations。這些路線允許 VS 找到 規則和屬性 來自 CUDA。
在新專案中,從 NVIDIA 範本 > CUDA 建立已安裝的版本。在現有項目中,請前往 建置依賴項 > 建置自訂項 並標記你的 CUDA 版本或指向 $(CUDA_PATH) 如果您想始終使用最新安裝的版本。
安裝或解除安裝工具包後,請驗證 $(CUDA_PATH) 指向正確的資料夾。訪問 環境變量 從系統屬性中檢查並調整值(如有必要)。
包含 CUDA 程式碼的檔案必須標記為 CUDA C/C++ 類型。您可以從 新增專案 > NVIDIA CUDA 13.0 > CUDA C/C++ 程式碼 在 Visual Studio 中。
使用 Conda 和 pip 安裝 CUDA
Conda:NVIDIA 在其 Anaconda 頻道上發佈軟體包(anaconda.org/nvidia) 安裝完整 Toolkit 或特定的先前版本。若要固定先前版本,請新增 發布標籤 到安裝命令,Conda 將解決依賴關係。
pip:NVIDIA 提供 Wheels 來安裝主要針對 Python 執行階段的 CUDA 元件。首先安裝 nvidia-pyindex 並確保你已更新 pip 和 setuptools。你可以在你的 requirements.txt 如果你比較喜歡。
Windows 上適用於 CUDA 12(cu12)的元包從最新可用版本中提取: 等等, nvidia-cublas-cu12, nvidia-cuda-cccl-cu12, nvidia-cuda-cupti-cu12, nvidia-cuda-nvcc-cu12, nvidia-cuda-nvrtc-cu12, nvidia-cuda-opencl-cu12, nvidia-cuda-runtime-cu12, nvidia-cuda-sanitizer-api-cu12, nvidia-cufft-cu12, nvidia-curand-cu12, nvidia-cusolver-cu12, nvidia-cusparse-cu12, nvidia-npp-cu12, nvidia-nvfatbin-cu12, nvidia-nvjitlink-cu12, nvidia-nvjpeg-cu12, nvidia-nvml-dev-cu12, nvidia-nvtx-cu12.
這些元包安裝特定版本的包,例如帶有後綴 cu129: nvidia-cublas-cu129, nvidia-cuda-cccl-cu129, nvidia-cuda-cupti-cu129, nvidia-cuda-nvcc-cu129, nvidia-cuda-nvrtc-cu129, nvidia-cuda-opencl-cu129, nvidia-cuda-runtime-cu129, nvidia-cuda-sanitizer-api-cu129, nvidia-cufft-cu129, nvidia-curand-cu129, nvidia-cusolver-cu129, nvidia-cusparse-cu129, nvidia-npp-cu129, nvidia-nvfatbin-cu129, nvidia-nvjitlink-cu129, nvidia-nvjpeg-cu129, nvidia-nvml-dev-cu129, nvidia-nvtx-cu129請記住,CUDA Wheels 不包含開發人員工具,僅包含執行時間。
使用 pip 表示 CUDA 環境與你的 Python 環境綁定。如果你打算在該環境之外編譯或執行,你還需要安裝 系統級工具包 以避免路線不一致。
WSL 上的 CUDA:Windows 11 和 Windows 10 21H2
Windows 11 和 Windows 10 21H2(及更高版本)可讓您在 WSL 中執行 CUDA 加速的 ML 框架和函式庫。這包括 PyTorch、TensorFlow、Docker 和 NVIDIA Container Toolkit,就像在原生 Linux 上一樣。
步驟 1:從官方網站安裝支援 CUDA 的 NVIDIA WSL 驅動程式。該驅動程式專門用於在發行版中公開 GPU。 WSL 上的 Linux.
步驟 2:啟用 WSL 並新增基於 glibc 的發行版(Ubuntu/Debian)。從 Windows 更新更新核心並驗證其是否 5.10.43.3或更高 跑步 wsl cat /proc/version 在 PowerShell 中。
步驟 3:依照 WSL 上的 NVIDIA CUDA 指南在發行版中安裝工具包和/或設定 NVIDIA Docker。 您將能夠使用 通常的 Linux 流程 加速 並將環境與主機 Windows 完美分開。
真實場景:混合使用 AMD + NVIDIA 筆記型電腦,12.8/11.8 出現錯誤
假設聯想 Ideapad 5 Pro 搭載 AMD Ryzen 處理器、AMD Radeon iGPU 和 NVIDIA GeForce GTX dGPU。運行 nvidia-smi 出現 驅動程式526.56 和 CUDA 版本 12.0,但嘗試安裝 CUDA 12.8 或 11.8 似乎不起作用。
理解它的關鍵:CUDA 版本線 nvidia-smi 表示驅動程式支援的最高 CUDA 執行時間版本,而不是已安裝的工具包版本。驅動程式 526.56 它支援 CUDA 12.0 和 11.8,但不支援 12.8,因為 12.8 需要更新的驅動程式(55x/56x 分支)。請從 NVIDIA 網站更新到最新的驅動程式(Studio 或 Game Ready DCH),然後重複安裝。
在混合型電腦上,請檢查 NVIDIA 控制面板或 Windows 圖形設置,以確保您的運算應用程式正在使用 NVIDIA GPU。如果沒有使用 dGPU, NVIDIA-SMI 這可能會導致問題,或者框架可能會載入到不支援 CUDA 的 AMD iGPU 上。請考慮全新安裝驅動程序,並驗證 GeForce Experience 是否能夠偵測到硬體。
特殊需求:ML.NET 模型建構器(僅限影像分類)
對於使用 Model Builder 的影像分類場景,Microsoft 需要一個特定的堆疊:CUDA 10.1 和 cuDNN 7.6.4。請小心,因為較新的版本不支援該特定流程。
cuDNN 7.6.4 的關鍵步驟:下載 CUDA 10.1 的 ZIP 文件,解壓縮並複製 cudnn64_7.dll 從 cuda\bin a C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin。您不能擁有多個版本的 神經網絡 同時;刪除其他版本的殘餘以避免執行過程中發生衝突。
此場景的硬體需求:至少一個支援 CUDA 的 GPU 和 6 GB 專用記憶體。如果沒有本機 GPU,模型產生器可以在 GPU 虛擬機器上進行訓練。 天藍,或最終在 CPU 上進行,儘管訓練時間要長得多。
快速診斷並解決常見問題
GPU 不會出現在“設定”或“工作管理員”中:開啟“裝置管理員”,在“顯示轉接器”下尋找,然後安裝對應的磁碟機。沒有驅動程式。 NVIDIA,Windows 不會將 dGPU 暴露給應用程式。
檢查系統的CUDA版本:在PowerShell/CMD運行 nvcc --version。如果失敗,請檢查工具包是否已安裝,以及 路徑 包括資料夾 bin 來自工具包。
此工具包未偵測到 CUDA 裝置:確保驅動程式是最新的,並且您的 GPU 在支援 CUDA 的清單中。 設備查詢 y 頻寬測試 它們是您的溫度計,用於確認硬體驅動工具包堆疊是否響應。
計算的驅動模式不正確:在計算 GPU 上,使用 nvidia-smi 檢查/切換 TCC(如適用)。在大多數筆記型電腦 GeForce 上, WDDM 這是預期模式,您無法變更它。
與 Python 框架的依賴衝突:如果您透過 pip 使用 CUDA Wheels,請記住它們僅涵蓋執行時,並且與虛擬環境綁定。要編譯擴充功能或使用工具,還需要安裝 系統工具包,或使用 Conda 大量管理所有內容。
範例、樣本和良好實踐
為了驗證效能和功能,編譯並運行 deviceQuery y bandwidthTest 來自範例儲存庫中的 VS 解決方案。建置通常會將二進位檔案保留在類似以下路徑中 CUDA 範例\v13.0\bin\win64\Release 如果您保留預設值。
為了直觀地了解 CUDA 的潛力,請執行以下圖形範例 particles。除了演示之外,他們還會幫你參考使用 共享內存 以及您自己專案中的網格/區塊模式。
具有 GPU 的雲端替代方案
如果您不想與本機驅動程式衝突或需要峰值功率,您可以選擇配備現代 GPU(A100、RTX 4090、A6000 等)的雲端執行個體。這些服務提供 立即部署,PyTorch/TensorFlow 的範本和即用即付,適用於強化訓練或快速測試。
註釋和標記
NVIDIA 技術文件和軟體包如有更改,恕不另行通知。請務必查看 發行說明 並在生產中安裝驅動程式或工具包之前更新相容性。
OpenCL 是 Apple Inc. 的商標,經 Khronos Group 授權使用。 NVIDIA 及其標誌是以下公司的商標或註冊商標: NVIDIA®(英偉達™)公司 在美國和其他國家。
有了正確的驅動程式、正確的工具包和一些精心完成的測試,Windows 就為 CUDA 奠定了堅實的基礎:您可以使用 Visual Studio 進行開發,使用官方範例進行驗證,像在 Linux 中一樣在 WSL 中運行 AI 框架,如果遇到困難,可以拉取替代安裝程式(Conda/pip)甚至雲端陷入困境; 重要的事情 是為了調整驅動程式和工具包版本,確認 NVIDIA GPU 是實際使用的,並支援您 設備查詢/頻寬測試 確保一切都是綠色的。 分享本教學課程,更多使用者將了解如何在 Windows 上安裝 CUDA。