Sean Sodha – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。Thu, 29 Aug 2024 07:05:20 +0000zh-CN
hourly
1 196178272借助 NVIDIA NIM 智能體藍圖構建企業級多模態文檔檢索工作流
http://www.open-lab.net/zh-cn/blog/build-an-enterprise-scale-multimodal-document-retrieval-pipeline-with-nvidia-nim-agent-blueprint/
Wed, 28 Aug 2024 06:57:46 +0000http://www.open-lab.net/zh-cn/blog/?p=11088Continued]]>每年都會生成數萬億個 PDF 文件,每個文件可能由多個頁面組成,其中充滿了各種內容類型,包括文本、圖像、圖表和表格。這筆數據財富只能在人類能夠閱讀和理解的情況下才能快速使用。 但是,借助生成式 AI 和檢索增強生成(RAG),這些未開發的數據可以用于發現業務見解,從而幫助員工提高工作效率并降低成本。 想象一下,能夠準確地提取海量企業數據中包含的知識,有效地與數據對話,從而快速使您的數字人成為任何主題的專家。這反過來又使您的員工能夠更快地做出更明智的決策。 在本文中,我們將展示多模態 PDF 數據提取藍圖如何結合 NVIDIA NeMo Retriever 和 NVIDIA NIM 微服務,以及用于實現此目的的參考代碼和文檔。 PDF 是內容豐富的文檔,可存儲跨模式表達的精細信息,使其更加簡潔和易于理解。例如,PDF 可能包含用于傳達復雜信息的文本、表格、圖表、