數據科學

2025年 4月 29日
Kaggle 大師揭秘數據科學超能力的獲勝策略
來自 NVIDIA 的 Kaggle Grandmaster David Austin 和 Chris Deotte 以及 HP 的…
2 MIN READ

2025年 4月 29日
構建應用程序以安全使用 KV 緩存
在與基于 Transformer 的模型 (如 大語言模型 (LLM) 和 視覺語言模型 (VLM)) 交互時,輸入結構會塑造模型的輸出。
2 MIN READ

2025年 4月 23日
NVIDIA cuPyNumeric 25.03 現已完全開源,支持 PIP 和 HDF5
NVIDIA cuPyNumeric 是一個庫,旨在為基于 Legate 框架構建的 NumPy 提供分布式和加速的插入式替換。
2 MIN READ

2025年 4月 17日
頂級大師專業提示:使用 NVIDIA cuDF-pandas 進行特征工程,在 Kaggle 競賽中奪冠
在處理表格數據時,特征工程仍然是提高模型準確性的最有效方法之一。與 NLP 和計算機視覺等神經網絡可以從原始輸入中提取豐富模式的領域不同,
2 MIN READ

2025年 4月 16日
在大型語言模型時代,通過消息量化和流式傳輸實現高效的聯邦學習
聯邦學習 (Federated Learning, FL) 已成為一種在分布式數據源中訓練機器學習模型的有前景的方法,同時還能保護數據隱私。
2 MIN READ

2025年 4月 15日
NVIDIA Llama Nemotron 超開放模型實現突破性的推理準確性
AI 不再只是生成文本或圖像,而是要針對商業、金融、客戶和醫療健康服務中的現實應用進行深度推理、詳細解決問題并實現強大的適應性。
2 MIN READ

2025年 4月 11日
使用 NVIDIA NIM 管理科學文獻中的生物研究成果
科學論文多種多樣,通常為同一實體使用不同的術語,使用不同的方法來研究生物現象,并在不同的上下文中展示研究結果。
2 MIN READ

2025年 4月 11日
借助 NVIDIA FLARE 和 Meta ExecuTorch,在移動設備上輕松進行聯邦學習
NVIDIA 和 Meta 的 PyTorch 團隊宣布開展突破性合作,通過集成 NVIDIA FLARE 和 ExecuTorch ,
3 MIN READ

2025年 4月 10日
高效擴展 Polars 的 GPU Parquet 讀取器
在處理大型數據集時,數據處理工具的性能變得至關重要。 Polars 是一個以速度和效率聞名的開源數據操作庫,提供由 cuDF 驅動的 GPU…
2 MIN READ

2025年 4月 7日
使用合成數據評估和增強 RAG 工作流性能
隨著 大語言模型 (LLM) 在各種問答系統中的普及, 檢索增強生成 (RAG) 流程也成為焦點。
1 MIN READ

2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 掃描
隨著各行各業企業的數據規模不斷增長, Apache Parquet 已成為一種重要的數據存儲格式。
3 MIN READ

2025年 3月 26日
聚焦:Tomorrow.io 借助 NVIDIA AI 改變全球天氣恢復能力
從指導日常運營的超本地化預測,到啟發新氣候見解的行星級模型,世界正在進入天氣和氣候適應能力的新前沿。
2 MIN READ

2025年 3月 26日
使用 PyG 和圖形數據庫通過 GraphRAG 提高問答準確性
大語言模型(LLMs)在處理特定領域的問題時往往難以保證準確性,尤其是那些需要多跳推理或訪問專有數據的問題。
3 MIN READ

2025年 3月 25日
聚焦:AXA 借助 NVIDIA Earth-2 探索 AI 驅動的颶風風險評估
大型集成對于預測僅通過歷史數據無法完全理解的罕見、高影響事件至關重要。通過模擬數千個潛在場景,它們提供了必要的統計深度,以評估風險、
2 MIN READ

2025年 3月 25日
利用 NVIDIA Earth-2 提升洪水風險評估能力
陸地洪水每年都會造成重大的經濟和社會影響。在 2024 年給保險業造成超過 10 億美元損失的八場自然災害中,有六場被歸類為洪水事件,
3 MIN READ

2025年 3月 24日
集成 Flower和 NVIDIA FLARE,加速聯邦學習生態系統發展
近年來, Flower 和 NVIDIA FLARE 等開源系統已成為聯邦學習 (FL) 領域的關鍵工具,每個系統都有其獨特的關注點。
3 MIN READ