Markel Ausin

Markel Ausin 是 NVIDIA 的深度學習算法工程師。在目前的角色中,他致力于構建和部署大型語言模型,作為 NeMo- Megatron 框架的一部分。 Markel 針對 NVIDIA DGX SuperPOD 集群開發了數據準備、模型訓練、評估和模型檢查點轉換的解決方案。 Markel 是超參數搜索工具的主要開發人員,該工具搜索給定模型的最佳配置,并決定如何在多個 GPU 上拆分模型。在 NVIDIA 之前, Markel 在北卡羅來納州立大學完成了博士學位,研究如何使用深度強化學習改進教育系統。

Posts by Markel Ausin

對話式人工智能

NVIDIA AI 平臺為大型語言模型帶來巨大收益

隨著大型語言模型( LLM )的規模和復雜性不斷增長, NVIDIA 今天宣布更新 NeMo Megatron 框架,提供高達 30% 2 MIN READ