Author:

3 月 19 日下午 2 點，鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看

Sandeep Subramanian

Sandeep 是 NVIDIA 的研究經理。他的研究重點是大型語言模型的訓練和對齊。他獲得卡內基梅隆大學 NLP 碩士學位和蒙特利爾大學深度學習博士學位。

對話式人工智能 2023年 8月 8日

這個大型語言模型 (LLM) 縮放規律的最新發展已經表明，當模型參數的數量進行縮放時，用于訓練的令牌的數量也應該以相同的速率進行縮放。 2 MIN READ