Posts by Kirthi Devleker
生成式人工智能/大語言模型
2025年 2月 13日
使用 DeepSeek-R1 和推理時間縮放實現自動化 GPU 內核生成
隨著 AI 模型擴展其功能以解決更復雜的挑戰,一種稱為“ 測試時擴展 ”或“ 推理時擴展 ”的新擴展法則正在出現。
2 MIN READ
數據中心/云端
2024年 3月 18日
NVIDIA GB200 NVL72 提供萬億參數 LLM 訓練和實時推理
對萬億參數模型的興趣是什么?我們知道當今的許多用例,并且由于有望提高以下方面的能力,人們的興趣正在增加: 其優勢是巨大的,
3 MIN READ