Posts by Neal Vaidya
生成式人工智能/大語言模型
2024年 6月 7日
借助 NVIDIA NIM 無縫部署大量 LoRA Adapters
最新的先進基礎大型語言模型 (LLM) 擁有數十億個參數,并已在數萬億個輸入文本標記上進行了預訓練。它們通常在各種用例上都取得了驚人的成果,
2 MIN READ
生成式人工智能/大語言模型
2024年 4月 22日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服務器提升 Meta Llama 3 性能
我們很高興地宣布支持 Meta Llama 3 系列模型,通過 NVIDIA TensorRT LLM 加速和優化 LLM 推理性能。
2 MIN READ
數據中心/云端
2024年 3月 18日
NVIDIA NIM 提供經過優化的推理微服務,用于大規模部署 AI 模型
數字生成的生成式 AI 采用率一直很高。在 2022 年推出 OpenAI 聊天 GPT 的推動下,
2 MIN READ
對話式人工智能
2023年 11月 17日
掌握 LLM 技術:推理優化
通過堆疊 Transformer 層來創建大型模型,可以提高準確性、實現少量學習功能,并且在各種語言任務中實現近乎人類的性能。
4 MIN READ
數據中心/云端
2023年 11月 15日
NVIDIA AI Foundation 模型:使用生產就緒型 LLM 構建自定義企業聊天機器人和 Co-Pilot
大型語言模型(LLM)正在革新數據科學領域,特別是在自然語言理解、AI 以及 機器學習 方面。
3 MIN READ
生成式人工智能/大語言模型
2023年 10月 19日
現已公開發布!歡迎使用 NVIDIA TensorRT-LLM 優化大語言模型推理
NVIDIA 于 2023 年 10 月 19 日公開發布 TensorRT-LLM,
3 MIN READ