Prachi Goel – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 12 Dec 2024 04:07:59 +0000 zh-CN hourly 1 196178272 RAPIDS cuDF 統一顯存技術使大型數據集上的 pandas 運行速度最高提升 30 倍 http://www.open-lab.net/zh-cn/blog/rapids-cudf-unified-memory-accelerates-pandas-up-to-30x-on-large-datasets/ Fri, 09 Aug 2024 07:08:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=10996 Continued]]> NVIDIA 已發布 RAPIDS cuDF 統一顯存和文本數據處理功能,幫助數據科學家在嚴苛的工作負載中處理更大、文本密集型數據集時繼續使用 pandas。現在,數據科學家可以將這些工作負載加速高達 30 倍。 RAPIDS 是開源 GPU 加速數據科學和 AI 庫的集合。cuDF 是一個 Python GPU DataFrame 庫,用于加載、連接、聚合和過濾數據。 作為面向數據科學家的頂級數據處理庫,pandas 是一個靈活而強大的 Python 數據分析和操作庫。上個月,它的下載量超過 2000 萬次。然而,隨著數據集規模的增長,pandas 在 CPU 系統中的處理速度和效率都很低。這迫使數據科學家不得不在緩慢的執行時間和使用其他工具相關的切換成本之間做出選擇。 NVIDIA 在 GTC 2024 上宣布,RAPIDS cuDF 可將 pandas 的速度提升近…

Source

]]>
10996
RAPIDS cuDF 在 Google Colab 上瞬間加速 pandas 達 50 倍 http://www.open-lab.net/zh-cn/blog/rapids-cudf-instantly-accelerates-pandas-up-to-50x-on-google-colab/ Tue, 14 May 2024 06:47:37 +0000 http://www.open-lab.net/zh-cn/blog/?p=9990 Continued]]> 在谷歌 I/O’24 上,谷歌人工智能倡導主管 Laurence Moroney 宣布:RAPID cuDF 現已集成到 Google Colab 中。這意味著,開發人員現在可以在谷歌 Colab 的 GPU 實例上將 panda 代碼加速到 50 倍,并且隨著數據的增長繼續使用 panda,而不會犧牲性能。 RAPIDS cuDF 是一個基于 GPU 的 DataFrame 庫,可以在零代碼更改的情況下加速數據處理工具 Pandas。Google Colab 是基于 Python 的數據科學最受歡迎的平臺之一,它已經成為 一個月擁有超過 1000 萬用戶的標準工具。 作為一個云托管平臺,Colab 提供了一個開箱即用的數據科學筆記本環境,可以從瀏覽器訪問。其易于使用的基礎設施包括免費和付費層的 GPU。 您可以使用啟用 GPU 的 Colab 筆記本電腦頂部的單個命令,

Source

]]>
9990
加速數據分析:使用 RAPID cuDF 進行更快的時間序列分析 http://www.open-lab.net/zh-cn/blog/accelerated-data-analytics-faster-time-series-analysis-with-rapids-cudf/ Tue, 14 Mar 2023 04:23:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=6463 Continued]]> 這篇文章是 加速數據分析系列文章的一部分: 由于標準探索性數據分析( EDA )工作流程通常局限于單個核心,因此它得益于 RAPIDS cuDF 的加速計算,這是一個具有 pandas 類接口的加速數據分析庫。眾所周知,時間序列數據需要額外的數據處理,這會增加工作流程的時間和復雜性,使其成為利用 RAPIDS 的另一個很好的用例。 使用 RAPIDS cuDF ,您可以加快對不太大也不太小的“金發姑娘”數據集的時間序列處理。這些數據集在 pandas 上很繁重,但不需要像 Apache Spark 或 Dask 這樣的完全分布式計算工具。 本節介紹了依賴時間序列數據的 機器學習 ( ML )用例,以及何時考慮加速數據處理。 時間序列數據無處不在。時間戳在許多類型的數據源中都是一個變量,從天氣測量和資產定價到產品購買信息等等。 時間戳具有所有級別的粒度,

Source

]]>
6463
加速數據分析:使用 RAPID cuDF 加速數據探索 http://www.open-lab.net/zh-cn/blog/accelerated-data-analytics-speed-up-data-exploration-with-rapids-cudf/ Tue, 14 Mar 2023 03:57:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=6460 Continued]]> 這篇文章是 加速數據分析 系列文章的一部分: 氣候建模、醫療保健、金融和零售業的數字進步正在產生前所未有的數據量和類型。 IDC 表示,到 2025 年,將有 180 ZB 的數據,而 2020 年為 64 ZB ,這將擴大對數據分析的需求,將所有數據轉化為見解。 NVIDIA 提供 RAPIDS 開源軟件庫和 API 套件,使數據科學家能夠完全在 GPU 上執行端到端的數據科學和分析管道。這包括使用我們的 DataFrame API : RAPIDS cuDF 進行分析和數據科學的常見數據準備任務。 在典型的數據分析工作流程中,速度高達 40 倍,加速的數據分析為您節省了時間,并增加了可能受到當前分析工具限制的迭代機會。 為了解釋加速數據分析的價值,我們在本文中使用 RAPIDS cuDF 進行了一個簡單的探索性數據分析( EDA )教程。

Source

]]>
6460
利用數據增強零信任安全性 http://www.open-lab.net/zh-cn/blog/enhancing-zero-trust-security-with-data/ Tue, 17 May 2022 08:26:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4180 Continued]]> 隨著遠程和混合工作、自帶設備( BYOD )和基于云的基礎設施等數字企業趨勢的發展,設備和用戶如何與企業網絡交互,網絡安全也在不斷發展。有關更多信息,請參閱 零信任體系結構 。 如今,零信任是網絡安全領域的熱門話題,在 網絡安全會議和總統新聞發布室 中也有討論。零信任通常被解釋為結合了高摩擦策略,如持續的重新認證提示和自動注銷,這會給用戶體驗帶來障礙、時間和挫折。但利用零信任原則并不一定意味著將用戶交付給一個我們花在嘗試訪問數字資源和使用數字資源上的時間一樣多的世界。 在這篇文章中,我們澄清了關于零信任的困惑,并討論了一個深思熟慮的網絡安全團隊如何構建一個零信任系統,以確保用戶和數據的安全,并保持無縫的用戶體驗。 在評估如何最好地利用零信任原則之前,請后退一步定義它。據 零信任體系結構 論文稱,零信任是一種持續驗證的網絡安全框架,將“防御從靜態、

Source

]]>
4180
利用 NVIDIA Morpheus 設計一個新的網絡釣魚檢測網絡 http://www.open-lab.net/zh-cn/blog/designing-a-new-net-for-phishing-detection-with-nvidia-morpheus/ Mon, 16 May 2022 05:51:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4018 Continued]]> 在數字革命期間,電子郵件成為最普遍、最強大的通信工具之一。通過電子郵件偽裝成合法的人或機構來欺騙用戶的企圖變得如此普遍,以至于它有了自己的名字: phishing 。 如今,隨著數字世界深深交織在我們的工作和個人生活中,網絡釣魚仍然是 2021 勒索軟件事件的前三大初始感染媒介 中的一種,并在 復雜度和規模 中發展。隨著網絡釣魚造成的損失增加,風險只會增加。 大多數網絡釣魚網絡安全防御結合了基于規則的電子郵件過濾器和人工培訓來檢測欺詐電子郵件。當過濾器出現故障時,人類也會面臨這樣的風險,盡管經過了加強可疑電子郵件檢測的培訓。 只要一次人為錯誤,企業就會損失數百萬美元,并需要時間來解決。為了減少違規行為,從一開始就必須杜絕網絡釣魚進入任何收件箱。 目前基于規則的系統在他們看來是有限的。他們只能“看到”已知的問題,欺詐者通常比這些系統領先一步。

Source

]]>
4018
人人超碰97caoporen国产