準確的天氣建模對于公司正確預測可再生能源生產和規劃自然災害至關重要。僅在 2022 年,無效和未預測的天氣就造成了 7140 億美元的損失。為了避免這種情況,公司需要更快、更便宜、更準確的天氣模型。
在最近的一個GTC 會議、微軟和 TempoQuest 詳細介紹了他們與 NVIDIA 為解決這一能源和氣候問題所做的工作。 TempoQuest 是 NVIDIA Inception 計劃的成員,可實現超本地低延遲天氣和環境預報。我們的團隊是多學科的,涵蓋大氣科學、氣象學、 HPC 、人工智能、 ML 、工程等。我們一直是將 GPU 引入環境部門的領先采用者,包括:
- 第一個到端口 WRF 到 GPU
- 第一個比基于 CPU 的預測更快、更便宜地創建更高分辨率的預測
- 首先開發 GPU 軟件即服務天氣預報系統
在這篇博客文章中,我們將分享 TempoQuest 如何利用微軟 Azure 上 NVIDIA 的加速計算,將傳統的天氣研究和預測( WRF )軟件轉移到 GPU ,提供小于一公里的分辨率和一分鐘到一小時的時間分辨率,并能夠更快地預測可再生風能和太陽能資源的發電量。
整合可再生能源面臨的公用事業挑戰
公用事業公司利用可再生能源(主要是風能和太陽能)管理電網是一項挑戰。這些能源因環境因素而異,如云覆蓋率和風速。如果可再生能源發電不足以滿足需求,公用事業公司必須使用“旋轉儲備”——發電機生產的碳基電力——來彌補短缺。為了更好地預測可再生能源發電,需要快速、準確和具有成本效益的天氣預報。

能源行業必須完成三個關鍵功能:發電、輸電和配電。目前主要使用碳基燃料生產的發電正在向包括風能和太陽能在內的可再生能源過渡,以在實現凈零排放方面取得進展。接下來是輸電,發電通過升壓變壓器并通過高壓線路輸送。在遙遠的電網邊緣,電力通過 transformer 和變電站“降壓”,向家庭和企業的消費者輸送電力( 240 V / 120 V )。
向電網增加更多可再生能源不僅需要公用事業公司整合新的發電站,還需要建造更多的高壓輸電線路和輸電塔。這給電網維護帶來了額外的復雜性和成本,包括資本和運營費用。高分辨率 GPU – 加速 WRF 可以通過減少對碳基電力的依賴和優化可再生能源的使用來提供幫助。
使用 GPU 加速 WRF
AceCAST 代表“加速預測”,是運行一個名為 WRF 或“天氣研究和預測”的區域模型的結果,該模型在 160 個國家被 50000 名用戶廣泛使用。我們使用專有的 OpenACC 和 CUDA 移植 WRF ,使其在帶有 NVIDIA GPU 的 x86 系統上運行,并在多 GPU 和多節點系統上進行擴展。 AceCAST 支持所有主要的 WRF 動力學、物理方案和名稱列表選項,是現有 WRF 配置的替代品。
AceCAST 有多種好處,包括更快的解決時間、更高的分辨率和更高的精度、對局部天氣現象的更高認識以及降低計算成本。
我們的測試表明,在天氣預報和預測可再生能源方面, GPU 比 CPU 更快、分辨率更高、成本效益更高。這種加速解決方案對于減少碳發電、提高電網可靠性和管理以及降低消費者的能源成本非常重要。
AceCAST 驗證和性能成本分析
為了驗證我們的基準測試結果,我們首先確保 CPU WRF 與 GPU WRF 的差異在可接受的公差范圍內。然后,我們在幾個時間和空間預測范圍內測試了模型性能。最后,我們驗證了數千個測試用例,以確保 AceCAST 產生與 CPU WRF 相同的結果。在 Microsoft Azure 上運行性能測試顯示,性能和成本都存在很大差異。
基于 CPU 的 WRF –標準 HB120rs _ v3 虛擬機( HBv3 ):
- 120 AMD EPYC? 7V73X-series (Milan-X) CPU cores
- 450 GB RAM ( 350 GB /秒內存帶寬)
- 200 Gb / s HDR 無限帶寬
- 2 x 1 TB NVME SSD 磁盤
- NCAR WRF 4.2.2
- 使用并行網絡 CDF
- 使用英特爾編譯器和 MPI 編譯
GPU-accelerated WRF – Standard_ND96amsr_A100_v4 (NDmv4):
- 8 NVIDIA A100 Tensor Core GPU ( 80GB )
- NVLink 3 . 0 ( 200 Gb / s HDR InfiniBand )
- 96 AMD EPYC? 7V12-series (Rome) CPU cores
- 8 x 1 TB NVME SSD 磁盤
- AceCAST 2 . 1 版
- 使用 OpenACC 和 CUDA 的專有實現
- 使用 MPI 在多節點和多 – GPU 上縮放
Azure 托管 Lustre 文件系統
- 40TiB 存儲 Azure 托管容量
- 10000 MB / s 最大吞吐量

我們的結果表明,與一個節點上基于 CPU 的 WRF 相比,一個節點的 GPU 加速的 WRF ( AceCAST )實現了約 9 倍的加速度,而需要 18 個 CPU ‘節點才能實現與一個 GPU ‘節點類似的性能。這些結果至關重要,因為更快、更低成本的天氣預報使公用事業公司能夠更準確地預測可再生能源發電,提供可靠的電力,并避免過度停電。
對 AceCAST 3 . 0 . 1 的進一步測試顯示,性能進一步提高。我們使用了一個嵌套域,外部域由 500 萬個網格點( 430x331x38v )和 15 公里網格間距組成,而內部域由 8000 萬個網格點通過( 1551x1361x38v )和 3 公里網格間距構成。

結果顯示,與 1xHBv3 ( 64 CPU )相比, AceCAST 在 1xNDmA100V4 ( 8 GPU )上的內域計算和通信時間比 WRF 快 16 . 8 倍。對于單個作業,發現在 16 個 HBv3 ( CPU ) VM 上的最佳配置是 WRF ,在 1 個 NDmA100 ( GPU ) VM 和 8 個 GPU 上的最優配置是 AceCAST 。在這種情況下, AceCAST 的運行速度比基于 CPU 的 WRF 快 7% ,成本低 75% 。
可再生能源預測
讓我們以 AceCAST 應用于可再生能源預測來結束這一循環。美國的公用事業公司對所有 70000 多臺風力渦輪機以及每個風能和太陽能節點的位置都有規范。通過利用專有的天氣到電力算法, AceCAST 提供了更高的預測分辨率,以實現特定可再生能源發電站每天每小時的精確電力預測( MW )。
電網脫碳
隨著發電資產從集中式碳基技術向清潔分布式能源轉型,電網面臨實時管理供需的挑戰。預測可再生資產性能使公用事業公司能夠提高電網的可靠性和彈性。 NVIDIA 、微軟和 TempoQuest 之間的合作有助于應對這一重大的社會和全球挑戰。
使用 GPU 加速的 WRF 、 AceCAST 、 TempoQuest 正在以更低的成本加速風能和太陽能可再生資源的功率預測。這有助于優化負荷和發電平衡,降低公用事業的運營成本,管理可再生能源產量的波動,并產生更可靠的預測,以減少對碳基電力儲備的依賴。
要了解更多信息:
- 觀看完整 GTC 會議視頻
- 勘探NVIDIA A100 Tensor Core GPU
- 勘探NVIDIA on Microsoft Azure
- 了解如何carbon capture and storage數字孿生正在實現凈零
- 了解 NVIDIA 的特點改變電力和公用事業
要深入研究加速計算,請參閱GPU 加速庫論壇
?
?