收集商業見解可能是一件痛苦的事情,尤其是當你要處理無數的數據點時。
眾所周知, GPU 可以為數據科學家節省時間。 GPU 有助于加快流程并快速獲得所需的見解,而不是等待一個查詢運行。
在這個視頻中,Allan Enemark,RAPIDS數據可視化領先者,使用擁有超過30億個數據點的美國人口普查數據集,演示了在分析過程中如何不間斷地運行查詢RAPIDS cuDF和Plotly Dash。
主要收獲
- 使用 cuDF pandas,對于數百萬個數據點,每個查詢的運行時間不超過1秒,帶來了顯著的性能優勢。
- 使用集成的加速可視化框架有幾個優點,例如更快的分析迭代。
- 使用 cuDF 類 pandas RAPIDS 加速庫(如 GPU)取代基于 CPU 的庫有助于數據科學家快速完成 EDA 過程數據大小在2GB到10GB之間增加時。
- 可視化計算和渲染時間降低到交互式亞秒速度,從而暢通了洞察發現過程。
視頻 1 。用 RAPIDS cuDF 和 Plotly Dash 可視化人口普查數據
總結
將 pandas 與 cuDF 等 RAPIDS 框架進行交換可以幫助加快數據分析工作流程,使分析過程更加有效和愉快。此外, RAPIDS 庫可以使用簡單的 Python 代碼輕松繪制各種數據,如時間序列、地理空間和圖表。
要了解有關加快傳統 GPU 數據科學工作流程的更多信息,請訪問以下資源:
?