DASK – NVIDIA 技術博客

RAPIDS 與 Dask 結合實現多 GPU 數據分析的高效實踐指南

Thu, 21 Nov 2024 06:58:04 +0000

隨著我們向更密集的計算基礎設施邁進，擁有更多的計算、更多的 GPU、加速網絡等，多 GPU 訓練和分析變得越來越流行。隨著開發者和從業者從 CPU 集群轉向 GPU 集群，我們需要工具和最佳實踐。RAPIDS 是一套開源的 GPU 加速數據科學和 AI 庫。借助 Spark 和 Dask 等工具，這些庫可以輕松地針對更大的工作負載進行橫向擴展。本博文簡要概述了 RAPIDS Dask，并重點介紹了多 GPU 數據分析的三種最佳實踐。在使用 GPU 實現最高性能時，用戶通常會面臨內存壓力和穩定性問題。雖然 GPU 在計算方面比 CPU 更強大，但與系統內存相比，GPU 的內存通常更少。例如，GPU 工作負載通常在核外場景中執行，此時 GPU 內存小于一次處理工作負載所需的內存總量。此外，CUDA 生態系統提供了多種類型的內存，用于不同的目的和應用。

Source

]]>

使用 RAPIDS 加速 KubeFlow 上的 ETL

Tue, 30 Aug 2022 05:45:00 +0000

在機器學習和 MLOps world ， GPU 被廣泛用于加速模型訓練和推理，但工作流的其他階段（如 ETL 管道或超參數優化）如何？在 RAPIDS 數據科學框架， ETL 工具的設計使使用 Python 的數據科學家具有熟悉的外觀。您當前使用的是 Pandas , NumPy , Scikit Learn ，或 PyData Stack 在您的 KubeFlow 工作流中？如果是這樣，您可以使用 RAPIDS 通過利用集群中可能已經存在的 GPU 來加速工作流的這些部分。在本文中，我將演示如何將 RAPIDS 放入 KubeFlow 環境。首先在交互式筆記本環境中使用 RAPIDS ，然后擴展到單個容器之外，使用 Dask 跨多個節點使用多個 GPU 。本文假設您已經對 Kubernetes 和 KubeFlow 有所了解。

Source

]]>

使用 fsspec 優化對拼花地板數據的訪問

Thu, 05 May 2022 07:26:00 +0000

隨著數據集規模的不斷擴大，采用 Amazon S3 和谷歌云存儲（ GCS ）等云存儲平臺變得越來越流行。盡管節點本地存儲可能會帶來更好的 IO 性能，但在數據集超過單 TB 規模后，這種方法可能變得不切實際。在遠程存儲是唯一實用的解決方案的情況下， PyData 生態系統的許多部分已經采用文件系統規范（）作為通用文件系統 API 。自從和推出以來，已經為用戶提供了足夠的遠程存儲訪問權限，但內部字節傳輸和緩存算法還沒有對拼花等高性能文件格式進行特定于格式的優化。在本文中，我們將介紹模塊，它為遠程拼花文件提供了一種支持格式的字節緩存優化。這個模塊是實驗性的，并且僅限于一個公共 API :。此 API 提供了更快的遠程文件訪問。與 cuDF 和 cuDF 數據幀庫中的默認行為相比，對于大型拼花地板文件的部分 I / O （列塊和行組選擇），整體吞吐量有了一致的性能提升。

Source

]]>

在 Python 中加速與 Numba 和 Dask 的投資組合構建

Thu, 21 Oct 2021 07:21:00 +0000

Python 對數據科學家來說并不陌生。它是最流行的計算機語言，廣泛用于各種任務。盡管 Python 在運行時解釋代碼時速度非常慢，但對于某些數據科學工作，許多流行的庫使其在 GPU 上高效運行。例如，TensorFlow和PyTorch等流行的深度學習框架可以幫助 AI 研究人員高效地運行實驗。然而，在某些領域，如投資組合優化，沒有 Python 庫可以輕松加速計算工作。開發人員必須從頭開始實現算法，才能在 GPU 上加速。在這篇文章中，我們將展示如何使用 Numba 和Dask將投資組合構建算法加速 800x ，如以前的博客中介紹的那樣。 Numba 是一個 cuDF 庫，它簡化了 GPU 算法與 Python 的實現。 Python GPU 內核可以編譯為在 GPU 上運行。它使 CUDA 的編寫更易于 Python 開發人員使用。對于不適合單個 GPU 的較大問題，

Source

]]>