• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據中心/云端/邊緣

    使用 NVIDIA PhysicsNeMo v22.09 增強數字孿生模型和仿真

    最新版本的 NVIDIA PhysicsNeMo 是一個人工智能框架,它允許用戶為數字孿生、氣候模型和基于物理的建模與仿真創建可定制的培訓管道,現在可以下載。

    此次發布的物理 ML 框架 NVIDIA PhysicsNeMo v22.09 包括關鍵的增強功能,以增加神經運算符體系結構的合成靈活性,改進訓練收斂性和性能,最重要的是,顯著改進了用戶體驗和文檔。

    您可以從 NGCNGC 下載 GitLab 容器的最新版本,或訪問 PhysicsNeMo 上的 PhysicsNeMo repo 。

    神經網絡架構

    此更新擴展了傅里葉神經運算符( FNO )、物理信息神經運算符( PINO )和 DeepONet 網絡架構實現,以支持使用 PhysicsNeMo 中的其他內置網絡進行定制。更具體地說,通過此更新,您可以:

    • 通過改進的 FNO 、 PINO 和 DeepONet 體系結構,跨問題實現更好的初始化、定制和泛化。
    • 通過將 PhysicsNeMo 內的任何點式網絡(如 Sirens 、 Fourier Feature networks )和 FNO / PINO 解碼器部分的 Modified Fourier Feature network 與頻譜編碼器相結合,探索新的網絡配置。
    • 使用 DeepONet 的分支網絡和主干網絡中的任何網絡來嘗試多種架構。這包括主干網中的物理信息神經網絡( PINN )。 FNO 也可以用于 DeepONet 的分支網絡。
    • 用一個新的 DeepONet 示例演示 DeepONet 的改進,以模擬穿過多孔介質的 Darcy 流。

    模型并行性是作為模型并行 AFNO 的 beta 特性引入的。這使得可以沿著通道維度跨多個 GPU 并行化模型。這種分解以高度并行的方式分布 FFT 和 IFFT 。矩陣乘法是分區的,因此每個 GPU 持有每個 MLP 層權重的不同部分,并為向前和向后傳遞執行適當的聚集、分散、縮減和其他通信例程。

    此外,現在支持 self-scalable tanh (Stan) 激活功能。眾所周知, Stan 具有更好的收斂特性,并提高了 PINN 訓練模型的精度。

    最后,通過 TorchScript 對 Sigmoid Linear Unit (SiLU) 內核融合的支持現在增加了對 PyTorch 符號梯度公式的上游更改。這對于需要計算高階導數以進行物理知識培訓的問題特別有用,在這種情況下可提供高達 1.4 倍的加速。

    建模增強和培訓功能

    每個 NVIDIA PhysicsNeMo 版本都改進了建模方面,以更好地將偏微分方程( PDE )映射到神經網絡模型,并改進訓練收斂性。

    新的 recommended practices in PhysicsNeMo 可用于幫助縮放和非尺寸化 PDE ,以幫助您正確縮放系統的單元,包括:

    • 用數值和單位定義物理量
    • 實例化非尺寸化對象以縮放數量
    • 通過代數操作跟蹤無量綱化量
    • 使用用戶指定的單位將非量綱化數量縮小到任何目標數量,以便于后期處理

    現在,您還可以使用 Selective Equations Term Suppression (SETS) 在系統內有效處理不同的規模。這使您能夠創建同一 PDE 的不同實例,并凍結 PDE 中的某些術語。這樣,較小規模的損失將最小化,從而改進 PINN 中剛性 PDE 的收斂性。

    此外,在 Hydra 配置 YAML 文件中配置的新 PhysicsNeMo APIs 使最終用戶能夠根據收斂標準(如總損失或單個損失項或他們可以指定的其他指標)終止培訓。

    新的 causal weighting scheme 解決了違反瞬態問題物理因果關系的連續時間 PINN 的偏差。通過重新計算殘差和初始條件的損失,可以獲得動力系統 PINNS 的更好收斂性和更好的精度。

    PhysicsNeMo 培訓性能、可擴展性和可用性

    每一個 NVIDIA PhysicsNeMo 版本都側重于提高培訓性能和可擴展性。通過這一最新版本, FuncTorch 被集成到 PhysicsNeMo 中,以便在 PINN 培訓中更快地計算梯度。 Regular PyTorch Autograd 使用反向模式自動微分,必須在for循環中逐行計算雅可比項和黑森項。 FuncTorch 消除了不必要的權重梯度計算,并可以使用反向和正向模式自動微分的組合更有效地計算雅可比矩陣和海森矩陣,從而提高訓練性能。

    PhysicsNeMo v22.09 文檔改進提供了關于框架工作流關鍵概念的更多上下文和細節,以幫助新用戶。

    PhysicsNeMo Overview 進行了增強,為物理驅動、純數據驅動以及物理和數據驅動建模方法提供了更多示例指導工作流。 PhysicsNeMo 用戶現在可以按照改進的介紹性示例逐步構建符合每個工作流關鍵概念的工作流。

    有關所有 PhysicsNeMo 功能的詳細信息,請訪問 PhysicsNeMo User Guide PhysicsNeMo Configuration 頁您還可以提供反饋和貢獻,作為 PhysicsNeMo GitLab repo .

    查看 NVIDIA 深度學習培訓中心自學課程, Introduction to Physics-Informed Machine Learning with PhysicsNeMo . 加入我們吧 GTC 2022 featured sessions 了解更多有關 NVIDIA PhysicsNeMo 研究和突破的信息。

    ?

    0

    標簽

    人人超碰97caoporen国产