Posts by Mostofa Patwary
對話式人工智能
2023年 8月 8日
策展萬億代幣數據集: NVIDIA NeMo 數據策展人介紹
這個大型語言模型 (LLM) 縮放規律的最新發展已經表明,當模型參數的數量進行縮放時,用于訓練的令牌的數量也應該以相同的速率進行縮放。
2 MIN READ
人工智能/深度學習
2020年 10月 6日
用 Megatron-CNTRL 為語言模型添加外部知識和可控性
大型語言模型,如 Megatron 和 GPT-3 正在改變人工智能。我們對能夠利用這些模型來創建更好的對話式人工智能的應用程序感到興奮。
2 MIN READ