Brian Slechta

Brian Slechta 是 NVIDIA GPU 架構團隊的 AI 架構總監。他熱衷于突破數據中心硬件和軟件性能的極限,以處理大規模 AI 工作負載。Brian 擁有伊利諾伊大學厄巴納 - 香檳分校的計算機系統工程碩士學位。

Posts by Brian Slechta

數據中心/云端

NVIDIA NVLink 和 NVIDIA NVSwitch 加速大語言模型推理性能

大型語言模型(LLM)越來越大,增加了處理推理請求所需的計算量。為了滿足服務當今LLM的實時延遲要求,并為盡可能多的用戶提供服務, 3 MIN READ
數據中心/云端

揭開萬億參數大型語言模型 AI 推理部署的神秘面紗

人工智能(AI)正在改變各行各業,解決精準藥物發現、自動駕駛汽車開發等重大人類科學挑戰, 4 MIN READ