Recommender Systems – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 02 Mar 2023 02:45:16 +0000
zh-CN
hourly
1
196178272 -
離線到在線: NVIDIA Merlin 實時推薦系統的功能存儲
http://www.open-lab.net/zh-cn/blog/offline-to-online-feature-storage-for-real-time-recommendation-systems-with-nvidia-merlin/
Wed, 01 Mar 2023 02:40:12 +0000
http://www.open-lab.net/zh-cn/blog/?p=6327
Continued]]>
由于 深度學習 的進步和矢量嵌入的使用,推薦模型近年來進展迅速。這些模型日益復雜,需要強大的系統來支持它們,在生產中部署和維護這些模型可能具有挑戰性。 在論文 Monolith: Real Time Recommendation System With Collisionless Embedding Table 中,字節跳動詳細介紹了他們如何構建一個推薦系統,以支持在線培訓、滾動嵌入更新、容錯等。 這篇文章詳細介紹了離線、在線和在線大型推薦系統架構。我們專注于部署,使用構建塊框架 NVIDIA Merlin 和實時數據層 Redis 構建端到端推薦系統的示例。最后,我們提供了云部署說明和管理的 Redis 選項,用于生產就緒和簡化架構。 下載 RedisVentures/Redis-Recsys GitHub 存儲庫中的代碼,并查看相關資產以遵循每個示例。
Source
]]>
6327
-
NVIDIA Merlin Distributed-Embeddings輕松快速訓練TB 級推薦模型
http://www.open-lab.net/zh-cn/blog/fast-terabyte-scale-recommender-training-made-easy-with-nvidia-merlin-distributed-embeddings/
Wed, 31 Aug 2022 03:19:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=5061
Continued]]>
Embedding在深度學習推薦模型中起著關鍵作用。它們被用于將輸入數據中的離散特征映射到向量,以便下游的神經網絡進行處理。Embedding 通常構成深度學習推薦模型中的大部分參數,大小可以達到 TB 級。在訓練期間,很難將它們放入單個 GPU 的內存中。因此,現代推薦系統可能需要模型并行和數據并行的分布式訓練方法組合,以最佳利用GPU計算資源來實現最好的訓練性能。 NVIDIA Merlin Distributed-Embeddings ,可以方便TensorFlow 2 用戶用短短幾行代碼輕松完成大規模的推薦模型訓練。 背景 在數據并行分布式訓練中,整個模型被復制到每個 GPU 上。在訓練過程中,一批輸入數據在多個 GPU 中分割,每張卡獨立處理其自己的數據分片,從而允許計算擴展到更大批量的數據。在反向傳播期間,計算的梯度通過reduction算子(例如,
Source
]]>
5061
-
Transformers4Rec :使用 NVIDIA Merlin 庫構建基于會話的建議
http://www.open-lab.net/zh-cn/blog/transformers4rec-building-session-based-recommendations-with-an-nvidia-merlin-library/
Tue, 28 Jun 2022 05:32:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4461
Continued]]>
推薦系統可以幫助您發現新產品并做出明智的決策。然而,在許多依賴于推薦的領域,如電子商務、新聞和流媒體服務,用戶可能無法跟蹤,或者根據當時的需求,用戶的口味可能會迅速變化。 基于會話的推薦系統是順序推薦的一個子領域,最近很受歡迎,因為它們可以在任何給定的時間點根據用戶的情況和偏好推薦項目。在這些領域中,捕捉用戶對項目的短期或上下文偏好很有幫助。 在本文中,我們將介紹基于會話的推薦任務,該任務由 NVIDIA Merlin 平臺的 Transformers4Rec 庫支持。然后,我們展示了使用 Transformers4Rec 在幾行代碼中創建基于會話的推薦模型是多么容易,最后,我們展示了使用 NVIDIA Merlin 庫的端到端基于會話的推薦管道。 NVIDIA Merlin 團隊于 ACM RecSys’21 發布,
Source
]]>
4461
-
NVIDIA GTC 2022 年大會上宣布了 NVIDIA AI 軟件的主要更新,包括語音推進、推薦、推理等
http://www.open-lab.net/zh-cn/blog/major-updates-to-nvidia-ai-software-advancing-speech-recommenders-inference-and-more-announced-at-nvidia-gtc-2022/
Tue, 22 Mar 2022 05:56:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3415
Continued]]>
在 GTC 2022 年,NVIDIA 宣布對其NVIDIA 人工智能軟件套件進行重大更新,以供開發人員構建實時語音人工智能應用程序,大規模創建高性能推薦程序,并在每個應用程序中優化推理,等等。觀看首席執行官 Jensen Huang 的 keynote ,了解 Nvidia 的最新進展。 今天,NVIDIA 宣布 Riva 2.0 正式上市。 Riva 是一款加速語音 AI SDK ,為實時應用程序提供模型、工具、完全優化的語音識別和文本到語音管道。 亮點包括: NVIDIA 也宣布 Riva 企業 ,為大規模部署的企業提供訪問 NVIDIA 語音專家的機會。企業可以 在 LaunchPad 中的現成基礎設施上使用引導實驗室試用 Riva。 將此 GTC 會話添加到您的日歷以了解更多信息: 今天,
Source
]]>
3415
-
NVIDIA Merlin 通過最新更新擴展了推薦者工作流的開源互操作性
http://www.open-lab.net/zh-cn/blog/nvidia-merlin-extends-open-source-interoperability-for-recommender-workflows-with-latest-update/
Mon, 22 Nov 2021 08:01:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2419
Continued]]>
數據科學家和機器學習工程師使用許多方法、技術和工具來準備、構建、培訓、部署和優化他們的機器學習模型。雖然技術領先 引用推薦人團隊工作流程中利用開源軟件的重要性 ,但大多數流行的機器學習方法、庫和框架的設計都不是為了支持和加速推薦者工作流。 NVIDIA Merlin 旨在簡化推薦人工作流程。最新的更新包括 Transformers4Rec ,這是一個新的庫,它包裝了 HuggingFace transformer 體系結構,以構建基于會話的建議的管道。它還添加了 SparseOperationsKit (SOK) ,一個新的 Python 包,支持稀疏訓練和深度學習推理( DL )。 這一最新版本重申了 NVIDIA 的 commitment 功能,幫助機器學習工程師和數據科學家使用開源規范構建塊開發和優化推薦系統。
Source
]]>
2419
-
NVIDIA 在 CUDA -X AI 軟件中發布更新和新功能
http://www.open-lab.net/zh-cn/blog/nvidia-releases-updates-and-new-features-in-cuda-x-ai-software/
Thu, 14 Oct 2021 03:52:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=1952
Continued]]>
NVIDIA CUDA -X AI 是一個深入學習的軟件堆棧,供研究人員和軟件開發人員構建高性能 GPU – 用于對話 AI 、推薦系統和計算機視覺的加速應用程序。 了解 CUDA -X AI 工具和庫的最新版本。有關 NVIDIA 開發工具的更多信息,請參加 NVIDIA GTC 上的在線研討會、培訓和“聯系專家”課程。 有關更多信息,請參閱documentation中每個軟件包的發行說明。 NVIDIA Triton 推理服務器是一種開源的推理服務軟件,它為生產中的應用程序提供快速、可擴展的 AI 模型。它支持每一個框架,在每一個基于 GPU 或 CPU 的本地、云中和邊緣基礎設施上運行。 更新內容包括: 下載>> TensorRT 是一個高性能深度學習推理平臺。此版本包括: 開始>> NVIDIA NeMo…
Source
]]>
1952
人人超碰97caoporen国产