Posts by Vinh Nguyen
數據中心/云端
2025年 2月 12日
使用 NVIDIA NeMo 框架進行 LLM 模型剪枝和知識蒸餾
模型剪枝和知識蒸餾是功能強大且經濟高效的策略,用于從最初較大的同級獲得較小的語言模型。 在一篇“ 如何剪枝和蒸餾 Llama-3.1 8B ”…
4 MIN READ
數據中心/云端
2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初發布于 2024 年 8 月 21 日,但已根據當前數據進行了修訂。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ
數據中心/云端
2024年 8月 21日
Mistral-NeMo-Minitron 8B 基礎模型實現準確性巔峰
上個月,NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B,這是一款領先的先進的大型語言模型(LLM)。
1 MIN READ
數據中心/云端
2024年 8月 14日
如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提煉 Llama-3.1 8B
由于大型語言模型(LLM)的有效性和通用性,它們現在已經成為自然語言處理和理解領域的主導力量。LLM(例如 Llama 3.1…
4 MIN READ
生成式人工智能/大語言模型
2024年 6月 7日
借助 NVIDIA NIM 無縫部署大量 LoRA Adapters
最新的先進基礎大型語言模型 (LLM) 擁有數十億個參數,并已在數萬億個輸入文本標記上進行了預訓練。它們通常在各種用例上都取得了驚人的成果,
2 MIN READ