Posts by Shashank Verma
數據中心/云端
2025年 2月 12日
使用 NVIDIA NeMo 框架進行 LLM 模型剪枝和知識蒸餾
模型剪枝和知識蒸餾是功能強大且經濟高效的策略,用于從最初較大的同級獲得較小的語言模型。 在一篇“ 如何剪枝和蒸餾 Llama-3.1 8B ”…
4 MIN READ
生成式人工智能/大語言模型
2024年 7月 10日
使用 NVIDIA NeMo 定制化 NVIDIA NIM 滿足特定領域需求
為特定企業應用程序采用的大型語言模型(LLM)通常受益于模型自定義。企業需要根據其特定需求定制 LLM,
5 MIN READ
生成式人工智能/大語言模型
2024年 6月 18日
使用 NVIDIA Nemotron-4 340B,利用我們最新的開放式模型生成合成數據
自從引入并隨后廣泛采用大型語言模型(LLM)以來,數據一直是企業構建準確安全的人工智能系統的生命線。一家公司的數據代表了其累積的知識,
2 MIN READ
生成式人工智能/大語言模型
2024年 6月 7日
借助 NVIDIA NIM 無縫部署大量 LoRA Adapters
最新的先進基礎大型語言模型 (LLM) 擁有數十億個參數,并已在數萬億個輸入文本標記上進行了預訓練。它們通常在各種用例上都取得了驚人的成果,
2 MIN READ
生成式人工智能/大語言模型
2024年 2月 28日
使用 StarCoder2 釋放您的 LLM 編碼潛力
編碼在數字時代至關重要,但它也可能繁瑣且耗時。正因如此,許多開發者都在尋找方法,借助 NVIDIA DLSS 3 和 NVIDIA DLSS…
2 MIN READ
生成式人工智能/大語言模型
2024年 2月 23日
評估適用于企業級 RAG 的 Retriever
關于設計和評估的對話 檢索增強生成(RAG) 系統是一個漫長而多方面的討論。即使我們單獨研究檢索,開發者也會有選擇地使用許多技術,
3 MIN READ