Posts by Anu Srivastava
數據中心/云端
2025年 3月 12日
輕量級、多模態、多語種 Gemma 3 模型實現性能優化
使用基礎模型構建 AI 系統需要在內存、延遲、存儲、計算等資源之間實現微妙的平衡。在將生成式 AI 功能引入快速發展的 AI 應用生態系統時,
1 MIN READ
AI 平臺/部署
2025年 2月 26日
在 NVIDIA GPU 上訓練的 Microsoft Phi SLM 的多模態最新進展
大語言模型(LLMs)已滲透到各行各業,并改變了技術潛力。但是,由于規模龐大,它們對于許多公司目前面臨的資源限制來說并不切實際。
1 MIN READ
生成式人工智能/大語言模型
2024年 12月 17日
借助 NVIDIA TensorRT-LLM 預測解碼,將 Llama 3.3 的推理吞吐量提升 3 倍
隨著近期新增的 Llama 3.3 70B (一種純文本指令調整模型),Meta 的開放 大語言模型 (LLMs) 集合將繼續增長。
4 MIN READ