優化 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 11 Mar 2025 09:04:54 +0000
zh-CN
hourly
1
196178272 -
優化 CUDA C++ 編譯時間
http://www.open-lab.net/zh-cn/blog/optimizing-compile-times-for-cuda-c/
Mon, 10 Mar 2025 08:58:34 +0000
http://www.open-lab.net/zh-cn/blog/?p=13121
Continued]]>
在現代軟件開發中,時間是非常寶貴的資源,尤其是在編譯過程中。對于在大規模 GPU 加速應用程序上使用 CUDA C++的開發者而言,優化編譯時間可以顯著提高工作效率并簡化整個開發周期。 使用 編譯器進行離線編譯時,高效的編譯時間使您能夠快速構建代碼并保持勢頭。在使用 nvrtc 的即時 (JIT) 編譯環境中,最小化編譯時間有助于減少執行或運行時延遲,并提高應用程序性能。如果您在實時系統或交互式應用程序上工作,您將從盡可能快的編譯時間中受益匪淺。 理解編譯瓶頸的來源并不總是那么簡單。CUDA 編譯過程十分復雜,因為編譯器會對代碼執行各種優化和轉換,幾乎看不到代碼的哪些部分需要很長時間才能編譯。 例如,看似簡單的代碼行可能會觸發復雜的模板實例化,從而導致其他模板的遞歸擴展,進而消耗過多的編譯時間。如果不清楚幕后發生了什么,您就不知道編譯時間較長的根本原因是什么,
Source
]]>
13121
-
NVIDIA cuDSS 庫推動美國電網優化無障礙發展
http://www.open-lab.net/zh-cn/blog/nvidia-cudss-library-removes-barriers-to-optimizing-the-us-power-grid/
Tue, 19 Nov 2024 09:08:57 +0000
http://www.open-lab.net/zh-cn/blog/?p=12194
Continued]]>
隨著電力需求不斷增長,電網的電力系統優化(PSO)對于確保高效的資源管理、可持續性和能源安全至關重要。 東部互聯是北美的主要電網,由大約 70,000 個節點組成 (圖 1)。除了規模龐大之外,此類電網的優化還因災難性天氣事件和發電中斷等不確定性而變得復雜。 PSO 通常涉及解決大規模非線性優化問題,例如交變電流最優功率流(ACOPF)模型,這些模型通常包含數百萬個變量和約束。實時獲得準確的結果對于保持電網穩定性和效率至關重要,但這是一項極其困難的任務。 Sungho Shin 教授 (MIT)、François Pacaud 教授 (MINES Paris – PSL) 和博士后研究員 Alexis Montoison (ANL) 一直在開發非線性優化算法和求解器,這些算法和求解器使用 NVIDIA 工具來解決大規模 PSO 和其他復雜的非線性優化問題。
Source
]]>
12194
-
利用 NVIDIA NIM 和 cuOpt 構建供應鏈優化 AI 智能體
http://www.open-lab.net/zh-cn/blog/building-an-ai-agent-for-supply-chain-optimization-with-nvidia-nim-and-cuopt/
Tue, 16 Jul 2024 05:07:16 +0000
http://www.open-lab.net/zh-cn/blog/?p=10651
Continued]]>
企業在供應鏈決策中面臨著兩大挑戰:最大限度地提高利潤和快速適應動態變化。為了實現優化的供應鏈運營,企業需要依賴高級分析和實時數據處理,以適應快速變化的環境并做出明智的決策。 優化無處不在。為了履行客戶承諾并降低風險,組織運行數千個什么如果場景,以滿足客戶承諾并將風險降至最低。 例如,零售公司必須考慮交通、天氣和行駛里程等因素,以優化路線,并降低物流成本,其中超過一半的成本歸功于最后一英里配送?。 同樣,制藥公司必須應對復雜的供應鏈和監管限制,以及高昂的研發成本,這使得實時優化變得困難。 金融機構必須在波動的市場中平衡風險和回報,這需要復雜的數學模型(PDF)為決策制定。 農業 sector 需要處理不可預測的因素,如天氣和市場需求 在本文中,我們將展示如何使用線性編程和 LLM,借助 NVIDIA cuOpt 微服務中的優化 AI,克服優化挑戰,
Source
]]>
10651
-
用 RAPIDS 生成用于加速短期價格預測的限價訂單簿數據集
http://www.open-lab.net/zh-cn/blog/limit-order-book-dataset-generation-for-accelerated-short-term-price-prediction-with-rapids/
Fri, 19 May 2023 05:35:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=7028
Continued]]>
在高頻交易的世界里,成千上萬的市場參與者每天都在互動。據該報報道,事實上,高頻交易占美國股票交易量的一半以上高頻交易同步金融市場價格。 做市商是賣方的主要參與者,為市場提供流動性。投機者站在買方一邊,進行實驗和研究,希望從中獲利。最終用戶是向零售經紀人咨詢建議和交易的散戶投資者。總體而言,金融公司有興趣評估金融機器學習( ML )算法,以發現哪些算法最有利可圖。 研究人員最近發表了許多版本的這種類型的算法。我們試圖利用高頻數據和隨機森林( RF )模型的可解釋性,并選擇了本文中提出的 RF 方法研究短期價格預測的限價訂單簿特征:一種機器學習方法. 我們的研究發現,使用 GPU 的硬件加速減少了金融 ML 研究人員獲得預測結果所需的時間。由于大部分運行時間都可以用于分類器訓練,因此人們當然對更有效的訓練方法感興趣。 本文介紹了我們的研究,包括生成的數據集,
Source
]]>
7028
人人超碰97caoporen国产