Sandeep Subramanian

Sandeep 是 NVIDIA 的研究經理。他的研究重點是大型語言模型的訓練和對齊。他獲得卡內基梅隆大學 NLP 碩士學位和蒙特利爾大學深度學習博士學位。

Posts by Sandeep Subramanian

對話式人工智能

策展萬億代幣數據集: NVIDIA NeMo 數據策展人介紹

這個大型語言模型 (LLM) 縮放規律的最新發展已經表明,當模型參數的數量進行縮放時,用于訓練的令牌的數量也應該以相同的速率進行縮放。 2 MIN READ