Mohammad Shoeybi

Mohammad Shoeybi 是一位高級研究科學家,在 NVIDIA 管理應用深度學習研究小組的 NLP 團隊。他的團隊專注于語言建模, NLP 應用,如問答和對話系統,以及大規模培訓。他獲得了博士學位。 2010 年從斯坦福大學畢業。在 NVIDIA 之前,他曾在 DeepMind 和美國百度工作,致力于將深度學習和強化學習應用到應用程序中。

Posts by Mohammad Shoeybi

對話式人工智能

策展萬億代幣數據集: NVIDIA NeMo 數據策展人介紹

這個大型語言模型 (LLM) 縮放規律的最新發展已經表明,當模型參數的數量進行縮放時,用于訓練的令牌的數量也應該以相同的速率進行縮放。 2 MIN READ
人工智能/深度學習

用 Megatron-CNTRL 為語言模型添加外部知識和可控性

大型語言模型,如 Megatron 和 GPT-3 正在改變人工智能。我們對能夠利用這些模型來創建更好的對話式人工智能的應用程序感到興奮。 2 MIN READ