Reinforcement Learning – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Mon, 11 Jul 2022 03:02:12 +0000
zh-CN
hourly
1
196178272 -
利用深度強化學習設計算術電路
http://www.open-lab.net/zh-cn/blog/designing-arithmetic-circuits-with-deep-reinforcement-learning/
Fri, 08 Jul 2022 02:56:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4553
Continued]]>
隨著摩爾定律的放緩,開發其他技術來提高同一技術過程節點上芯片的性能變得越來越重要。我們的方法使用人工智能設計更小、更快、更高效的電路,以在每一代芯片中提供更高的性能。 大量的算術電路陣列為 NVIDIA GPU 提供了動力,使其在人工智能、高性能計算和計算機圖形學方面實現了前所未有的加速。因此,改進這些算術電路的設計對于提高 GPU 的性能和效率至關重要。 如果人工智能能夠學會設計這些電路呢?在 PrefixRL :使用深度強化學習優化并行前綴電路 中,我們證明了人工智能不僅可以從頭開始學習設計這些電路,而且人工智能設計的電路也比最先進的電子設計自動化( EDA )工具設計的電路更小更快。最新 NVIDIA Hopper GPU 結構 擁有近 13000 個人工智能設計電路實例。 在圖 1 中,電路對應于圖 5 中 PrefixRL 曲線中的( 31.4…
Source
]]>
4553
-
使用 MineDojo 構建具有一般能力的人工智能代理
http://www.open-lab.net/zh-cn/blog/building-generally-capable-ai-agents-with-minedojo/
Fri, 01 Jul 2022 07:23:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4510
Continued]]>
使用視頻游戲作為訓練人工智能的媒介已經成為人工智能研究界的一種流行方法。這些自主代理在 Atari 游戲、星際爭霸、 Dota 和 Go 中取得了巨大成功。但是,雖然這些進步在人工智能研究中很受歡迎,但與不斷從開放式任務中學習的人類不同,智能體并沒有泛化到一組非常特定的任務之外。 構建能夠在廣泛任務中實現高水平性能的嵌入式代理一直是人工智能研究界面臨的最大挑戰之一。為了構建一個成功的多面手代理,用戶需要一個支持多種任務和目標的環境、一個多模式知識的大規模數據庫和一個靈活且可擴展的代理體系結構。 進入 Minecraft ,世界上玩得最多的游戲。憑借其靈活的游戲性,玩家可以做各種各樣的動作。從建造中世紀城堡到探索危險環境,再到收集資源建造幽冥之門與幽冥之龍作戰。這種創造性的氛圍是培養具體化代理的完美環境。 為了利用這樣一個最佳的訓練場地,
Source
]]>
4510
-
為 NVIDIA MLPerf Training v2.0 性能提供動力的全堆棧優化
http://www.open-lab.net/zh-cn/blog/boosting-mlperf-training-performance-with-full-stack-optimization/
Thu, 30 Jun 2022 02:02:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4498
Continued]]>
MLPerf benchmarks 由工業界、學術界和研究實驗室的人工智能領導者組成的聯盟開發,旨在提供標準、公平和有用的深度學習性能測量。 MLPerf 訓練側重于測量時間,以便為以下任務訓練一系列常用的神經網絡: 減少培訓時間對于加快部署時間、最小化總體擁有成本和最大化投資回報至關重要。 然而,與平臺性能一樣重要的是它的多功能性。訓練每個模型的能力,以及提供基礎設施可替代性以運行從訓練到推理的所有人工智能工作負載的能力,對于使組織能夠最大限度地實現其基礎設施投資的回報至關重要。 NVIDIA platform 具有全堆棧創新和豐富的開發人員和應用程序生態系統,仍然是唯一提交所有八個 MLPerf 訓練測試結果,以及提交所有 MLPerf 推理和 MLPerf 高性能計算( HPC )測試結果的系統。 在本文中,您將了解 NVIDIA 在整個堆棧中部署的方法,
Source
]]>
4498
人人超碰97caoporen国产