數據分析/處理

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 處理
JSON 是一種熱門的文本數據格式,可實現 Web 應用程序中系統之間的互操作性以及數據管理。這種格式自 21 世紀初就已存在,
3 MIN READ

2025年 1月 16日
利用 RAPIDS cuML 加速時間序列預測
時間序列預測是一種強大的數據科學技術,用于根據過去的數據點預測未來值 借助 skforecast 等開源 Python 庫,
2 MIN READ

2025年 1月 13日
使用 NVIDIA NeMo Curator 提高生成式 AI 模型的準確性
在快速發展的人工智能領域,用于訓練模型的數據質量至關重要。高質量數據可確保模型準確、可靠,并且能夠在各種應用中很好地泛化。
1 MIN READ

2024年 12月 12日
利用 RAPIDS cuML 和 GPU 加速提升多標簽分類性能
現代分類工作流程通常需要將單個記錄和數據點分類為多個類別,而不僅僅是分配單個標簽。 借助 scikit-learn 等開源 Python 庫,
1 MIN READ

2024年 12月 5日
統一虛擬內存利用 RAPIDS cuDF 為 pandas 提供強力支持
上一篇文章 中介紹的 是一個 GPU 加速庫,可加速 pandas 以實現顯著的性能提升,速度最高可提升至原來的 50 倍,
2 MIN READ

2024年 11月 14日
NVIDIA RAPIDS 加速大型數據集的因果關系推理
隨著消費者應用生成的數據比以前更多,企業開始采用觀察數據的因果關系推理方法,以幫助闡明應用的各個組件的更改如何影響關鍵業務指標。
1 MIN READ

2024年 10月 15日
使用經 NVIDIA NeMo Curator 處理的 Zyda-2 Open 5T-Token 數據集訓練高度準確的 LLM
開源數據集顯著普及了對高質量數據的訪問,降低了開發者和研究人員訓練 尖端生成式 AI 模型 的門檻。通過免費訪問多樣化、
2 MIN READ

2024年 9月 17日
由 RAPIDS cuDF 提供支持的 Polars GPU 引擎現已推出公測版
今天,Polars 發布了一款由 RAPIDS cuDF 提供支持的新型 GPU 引擎,可在 NVIDIA GPUs 上將 Polars…
1 MIN READ

2024年 8月 9日
RAPIDS cuDF 統一顯存技術使大型數據集上的 pandas 運行速度最高提升 30 倍
NVIDIA 已發布 RAPIDS cuDF 統一顯存和文本數據處理功能,幫助數據科學家在嚴苛的工作負載中處理更大、
2 MIN READ

2024年 3月 18日
NVIDIA GB200 NVL72 提供萬億參數 LLM 訓練和實時推理
對萬億參數模型的興趣是什么?我們知道當今的許多用例,并且由于有望提高以下方面的能力,人們的興趣正在增加: 其優勢是巨大的,
3 MIN READ