accelerated data analytics – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 16 Mar 2023 07:59:49 +0000
zh-CN
hourly
1
196178272 -
加速數據分析:使用 RAPID cuDF 進行更快的時間序列分析
http://www.open-lab.net/zh-cn/blog/accelerated-data-analytics-faster-time-series-analysis-with-rapids-cudf/
Tue, 14 Mar 2023 04:23:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=6463
Continued]]>
這篇文章是 加速數據分析系列文章的一部分: 由于標準探索性數據分析( EDA )工作流程通常局限于單個核心,因此它得益于 RAPIDS cuDF 的加速計算,這是一個具有 pandas 類接口的加速數據分析庫。眾所周知,時間序列數據需要額外的數據處理,這會增加工作流程的時間和復雜性,使其成為利用 RAPIDS 的另一個很好的用例。 使用 RAPIDS cuDF ,您可以加快對不太大也不太小的“金發姑娘”數據集的時間序列處理。這些數據集在 pandas 上很繁重,但不需要像 Apache Spark 或 Dask 這樣的完全分布式計算工具。 本節介紹了依賴時間序列數據的 機器學習 ( ML )用例,以及何時考慮加速數據處理。 時間序列數據無處不在。時間戳在許多類型的數據源中都是一個變量,從天氣測量和資產定價到產品購買信息等等。 時間戳具有所有級別的粒度,
Source
]]>
6463
-
加速數據分析:使用 RAPID cuDF 加速數據探索
http://www.open-lab.net/zh-cn/blog/accelerated-data-analytics-speed-up-data-exploration-with-rapids-cudf/
Tue, 14 Mar 2023 03:57:01 +0000
http://www.open-lab.net/zh-cn/blog/?p=6460
Continued]]>
這篇文章是 加速數據分析 系列文章的一部分: 氣候建模、醫療保健、金融和零售業的數字進步正在產生前所未有的數據量和類型。 IDC 表示,到 2025 年,將有 180 ZB 的數據,而 2020 年為 64 ZB ,這將擴大對數據分析的需求,將所有數據轉化為見解。 NVIDIA 提供 RAPIDS 開源軟件庫和 API 套件,使數據科學家能夠完全在 GPU 上執行端到端的數據科學和分析管道。這包括使用我們的 DataFrame API : RAPIDS cuDF 進行分析和數據科學的常見數據準備任務。 在典型的數據分析工作流程中,速度高達 40 倍,加速的數據分析為您節省了時間,并增加了可能受到當前分析工具限制的迭代機會。 為了解釋加速數據分析的價值,我們在本文中使用 RAPIDS cuDF 進行了一個簡單的探索性數據分析( EDA )教程。
Source
]]>
6460
人人超碰97caoporen国产