向量搜索 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 23 Aug 2024 09:07:46 +0000 zh-CN hourly 1 196178272 Cyborg 和 RAPIDS cuVS 實現矢量搜索機密性保護 http://www.open-lab.net/zh-cn/blog/bringing-confidentiality-to-vector-search-with-cyborg-and-rapids-cuvs/ Thu, 15 Aug 2024 09:04:13 +0000 http://www.open-lab.net/zh-cn/blog/?p=11052 Continued]]> 在生成式 AI 時代,向量數據庫對于高效存儲和查詢高維數據已變得不可或缺。但是,與所有數據庫一樣,向量數據庫容易受到一系列攻擊,包括網絡威脅、網絡釣魚嘗試和未經授權的訪問。鑒于這些數據庫通常包含敏感和機密信息,這一漏洞尤其重要。 為了解決這一關鍵問題,Cyborg 與 NVIDIA 合作,使用 RAPIDS cuVS 庫增強向量數據庫的安全性。RAPIDS cuVS 庫是一個開源工具包,可使用先進的算法加速向量搜索。這項合作旨在為 Cyborg 的加密向量搜索引擎提供 NVIDIA 的 GPU 加速,在不影響性能的情況下確保強大的安全性。 向量數據庫是現代數據密集型應用程序的基石,為從檢索增強生成(RAG)流程到推薦系統的所有內容提供支持。 這些數據庫的高性能索引構建和搜索功能使其對此類應用程序至關重要,但其存儲的數據的價值使其成為惡意攻擊和漏洞的熱門目標。

Source

]]>
11052
加速向量搜索:RAPIDS RAFT IVF-Flat 近似算法 http://www.open-lab.net/zh-cn/blog/accelerated-vector-search-approximating-with-rapids-raft-ivf-flat/ Mon, 02 Oct 2023 04:45:11 +0000 http://www.open-lab.net/zh-cn/blog/?p=7963 Continued]]> 執行詳盡的精確 k 最近鄰 (kNN) 搜索,也稱為暴力搜索,成本高昂,并且它不能很好地擴展到更大的數據集。在向量搜索期間,暴力搜索需要計算每個查詢向量和數據庫向量之間的距離。對于常用的歐幾里德和余弦距離,計算任務等同于大型矩陣乘法。 雖然 GPU 在執行矩陣乘法方面效率很高,但隨著數據量的增加,計算成本變得令人望而卻步。然而,許多應用程序不需要精確的結果,而是可以為了更快的搜索而犧牲一些準確性。當不需要精確的結果時,近似最近鄰 (ANN) 方法通常可以減少搜索期間必須執行的距離計算的數量。 本文主要介紹了 IVF-Flat,這是 NVIDIA RAPIDS RAFT 中的一種方法。IVF-Flat 方法使用原始(即Flat)向量的倒排索引 (IVF)。此算法提供了簡單的調整手段,以減少整體搜索空間并在準確性和速度之間進行權衡。 為了幫助您了解如何使用 IVF-Flat,

Source

]]>
7963
加速矢量搜索:微調 GPU 索引算法 http://www.open-lab.net/zh-cn/blog/accelerating-vector-search-fine-tuning-gpu-index-algorithms/ Mon, 11 Sep 2023 05:23:50 +0000 http://www.open-lab.net/zh-cn/blog/?p=7830 Continued]]> 這個 系列的第一篇文章 介紹了矢量搜索索引,解釋了它們在實現廣泛的重要應用中所起的作用,并使用了 RAFT 庫。 在這篇文章中,我們深入探討第 1 部分中提到的每種 GPU 加速索引方法,并簡要解釋了算法的工作原理,以及總結重要的微調參數。 然后,我們通過一個簡單的端到端示例,用預訓練的大型語言模型演示 RAFT 在問答問題上的 Python API,并在涉及同時傳遞給搜索算法的不同查詢向量數量的幾個不同場景下,將 RAFT 的算法與 HNSW 的性能進行比較。 此帖子提供: 使用矢量搜索時,矢量通常會轉換為索引格式,該格式針對快速查找進行了優化。選擇正確的索引算法很重要,因為它會影響索引構建和搜索時間。此外,每種不同的索引類型都有自己的一組參數,用于微調行為、權衡索引構建時間、存儲成本、搜索質量和搜索速度。 當正確的索引算法與正確的參數設置配對時,

Source

]]>
7830
人人超碰97caoporen国产