生成式 AI 智能體開發者競賽：入門技巧

參加我們將于 6 月 17 日結束的比賽，使用前沿技術展示您的創新成果：由生成式 AI 驅動的應用程序，該應用程序使用 NVIDIA 和 LangChain 技術。為了讓您開始，我們將探索一些用于激發您的創意之旅的應用程序，同時分享提示和最佳實踐，幫助您在開發過程中取得成功。

快速激發您的創造力

生成式 AI 智能體有許多不同的實際應用。在之前的比賽中開發的智能體或 Copilot 應用會根據應用的隱私、安全和計算要求使用大型語言模型 (LLM) 或小型語言模型 (SLM)。

這些示例包括：

借助本地托管的 LLM 模型，專為 Outlook 設計的插件可幫助用戶撰寫電子郵件、總結電子郵件主題并回答收件箱問題。
使用命令行助手將簡單的英語指令轉換為可行的命令行提示，從而增強命令行界面。
視覺探索工具，可分析圖像并提供直觀的照片分析功能。

開發者可以在游戲、醫療健康、媒體和娛樂等領域創建用于內容生成的應用。其他選項包括總結、在醫療健康領域，客服人員可以通過分析患者癥狀、病史和臨床數據來幫助診斷疾病，例如問答環節。

其中許多想法都適用于您的數據和您想要解決的問題 – 無論是使用客服改善每周的雜貨店購物，還是在業務環境中優化客戶服務響應

開發之旅的快捷提示

開發由 LLM 或 SLM 驅動的應用程序需要集成多個組件。此過程包括準備數據、選擇合適的基礎模型、微調選定的基礎模型，以及針對各種下游任務編排模型。這些任務可能包括代理創建、推理服務和其他專用功能。

讓我們先來了解一下在 Omniverse Create 中基于 LLM 的智能體應用。在代理應用中，選擇合適的基礎模型至關重要，因為它在準確、高效地理解用戶查詢方面發揮著關鍵作用。此決策提出了幾個重要問題，例如選擇 LLM 還是 SLM，以及是否對模型進行量化。

這些問題的答案并不簡單，而是受到應用程序需求、部署基礎設施、所需推理速度和準確性要求等因素的影響。

下列提示值得牢記。

如果您的應用程序部署在顯存占用較小的 GPU 上，則應考慮在使用之前使用量化模型或量化現有模型。開發者可以使用的一些工具是量化框架，例如模型優化器及其各種插件，包括適用于大型語言模型的 NVIDIA TensorRT TensorRT-LLM。這些工具可以在 LangChain 框架中實現模型量化和優化。

如果推理準確性很重要，您應使用與其用例保持一致的基礎模型，但其中一些模型需要具有大顯存的 GPU。

如果您的目標是使用?檢索增強生成 (RAG)?在您的應用中，格式化和整理文檔是應用開發的一個重要方面。您可以利用諸如?NVIDIA NeMo Curator?或文檔加載器?等工具來支持處理不同的文檔模式，并查看我們?最近的博文，以獲取有關 NeMo Curator 的更多見解。

這些主題將幫助您開始使用您的應用程序。對于更高級的用例，例如微調和構建多智能體應用，您可以探索 NeMo 框架和 LangGraph。

立即注冊，開始構建新一代 AI 應用程序。

生成式 AI 智能體開發者競賽：入門技巧

快速激發您的創造力

開發之旅的快捷提示

相關資源

標簽

關于作者

生成式 AI 智能體開發者競賽：入門技巧

快速激發您的創造力

開發之旅的快捷提示

相關資源

標簽

關于作者

相關文章

NVIDIA 中構建 RAG 基問答大語言模型工作流程

開始使用適用于企業解決方案的大型語言模型

相關文章

聚焦：個人 AI 借助 NVIDIA Riva 為小企業主帶來 AI 接待員

使用 NVIDIA AI Blueprint 構建實時多模態 XR 應用以進行視頻搜索和摘要

圖像和視頻理解的視覺語言模型提示工程實踐指南

使用 NetworkX、Jaccard Similarity 和 cuGraph 預測您下一部最喜歡的電影

使用 GPU 在 Apache Spark 上加速 JSON 處理