Ronay AK – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 08 Jan 2025 04:52:01 +0000
zh-CN
hourly
1
196178272 -
開發具有高效數據存儲的多語種和跨語言信息檢索系統
http://www.open-lab.net/zh-cn/blog/develop-multilingual-and-cross-lingual-information-retrieval-systems-with-efficient-data-storage/
Tue, 17 Dec 2024 04:46:18 +0000
http://www.open-lab.net/zh-cn/blog/?p=12516
Continued]]>
高效的文本檢索對于搜索、問答、語義文本相似性、摘要和商品推薦等各種信息檢索應用至關重要。它還在檢索增強生成(RAG)技術中發揮著關鍵作用,該技術使 大語言模型(LLMs) 能夠在不修改基礎參數的情況下訪問外部上下文。 雖然 RAG 在提高 LLM 生成的響應質量方面非常有效,但由于主要使用英語數據集進行訓練,許多嵌入模型仍然難以檢索多種語言的正確數據。這限制了以其他語言生成準確且信息豐富的文本回復,阻礙了與全球受眾的有效溝通。 多語種信息檢索可提高生成文本的事實準確性和一致性,并實現本地化的上下文感知響應,從而消除語言障礙,使信息在全球范圍內更易于獲取。從改善臨床醫生與患者之間的溝通和故障排除技術問題,到提供個性化零售體驗,此功能可解鎖各行各業的各種應用。 然而,為大規模數據平臺創建此類系統會面臨獨特的挑戰,例如管理海量數據、確保低延遲檢索,
Source
]]>
12516
-
評估適用于企業級 RAG 的 Retriever
http://www.open-lab.net/zh-cn/blog/evaluating-retriever-for-enterprise-grade-rag/
Fri, 23 Feb 2024 06:58:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=9055
Continued]]>
關于設計和評估的對話 檢索增強生成(RAG) 系統是一個漫長而多方面的討論。即使我們單獨研究檢索,開發者也會有選擇地使用許多技術,例如查詢分解、重寫、構建軟過濾器等,以提高其 RAG 流程的準確性。雖然技術因系統而異,但嵌入模型通常是 RAG 中每個檢索流程的核心。 嵌入,尤其是密集嵌入,用于表達文本的語義結構。由于 RAG 中的所有檢索器都有一個關鍵的必須求解,以理解原始文本的語義,因此擁有系統的評估過程來選擇正確的過程至關重要。 我們展示了如何使用流行的庫,如scikit-learn和XGBoost,將聯邦線性模型、k-means 聚類、非線性 SVM、隨機森林和 XGBoost 應用于協作學習。 在本文中,您將學習: 如果您不熟悉檢索器在 RAG 中的作用,請查看 這篇博文介紹了如何使用 NVIDIA Retrieval QA Embedding 模型構建企業…
Source
]]>
9055
-
使用 NVIDIA 檢索 QA 嵌入模型構建企業檢索增強生成應用
http://www.open-lab.net/zh-cn/blog/build-enterprise-retrieval-augmented-generation-apps-with-nvidia-retrieval-qa-embedding-model/
Thu, 30 Nov 2023 06:31:11 +0000
http://www.open-lab.net/zh-cn/blog/?p=8359
Continued]]>
大型語言模型 (LLM) 對人類語言和編程語言的深刻理解正在改變 AI 格局。對于新一代企業生產力應用程序而言,它們至關重要,可提高用戶在編程、文案編輯、頭腦風暴和回答各種主題的問題等任務中的效率。 然而,這些模型通常難以處理實時事件和特定知識領域,從而導致不準確之處。微調這些模型可以增強其知識,但成本高昂,并且需要定期更新。 檢索增強生成(RAG)通過將信息檢索與 LLM 結合,為開放領域的問答應用提供解決方案。RAG 為 LLM 提供大量可更新的知識,有效解決了這些限制(圖 1)。NVIDIA NeMo 框架中的 NVIDIA NeMo Retriever 優化了 RAG 的嵌入和檢索部分,以提供更高的準確性和更高效的響應。 本文概述了 RAG 工作流組件的工作原理,以及與創建支持 RAG 的 AI 應用相關的企業挑戰(例如商業可行性)。
Source
]]>
8359
-
Transformers4Rec :使用 NVIDIA Merlin 庫構建基于會話的建議
http://www.open-lab.net/zh-cn/blog/transformers4rec-building-session-based-recommendations-with-an-nvidia-merlin-library/
Tue, 28 Jun 2022 05:32:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4461
Continued]]>
推薦系統可以幫助您發現新產品并做出明智的決策。然而,在許多依賴于推薦的領域,如電子商務、新聞和流媒體服務,用戶可能無法跟蹤,或者根據當時的需求,用戶的口味可能會迅速變化。 基于會話的推薦系統是順序推薦的一個子領域,最近很受歡迎,因為它們可以在任何給定的時間點根據用戶的情況和偏好推薦項目。在這些領域中,捕捉用戶對項目的短期或上下文偏好很有幫助。 在本文中,我們將介紹基于會話的推薦任務,該任務由 NVIDIA Merlin 平臺的 Transformers4Rec 庫支持。然后,我們展示了使用 Transformers4Rec 在幾行代碼中創建基于會話的推薦模型是多么容易,最后,我們展示了使用 NVIDIA Merlin 庫的端到端基于會話的推薦管道。 NVIDIA Merlin 團隊于 ACM RecSys’21 發布,
Source
]]>
4461
人人超碰97caoporen国产