• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    模擬/建模/設計

    高級 API 性能: SetStablePowerState

    這篇文章介紹了使用 設置表電源狀態關于 NVIDIA GPU 。要在應用程序中獲得高且一致的幀速率,請參閱所有 高級 API 性能提示 .

    大多數現代處理器,包括 GPU ,在應用程序執行期間更改處理器核心和內存時鐘速率。這些更改可能會改變性能,在測量中引入錯誤,并且很難在運行之間進行比較。

    推薦

    • 在嘗試測量之前,使用nvidia-smi實用程序設置 GPU 內核和內存時鐘。此命令由 Windows 和 Linux 上的典型驅動程序安裝程序安裝。安裝位置可能因操作系統版本而異,但應相當穩定。
      • 在 Windows 上的管理員控制臺上運行命令,或在 Linux (如 OSs )上為以下命令添加前置命令sudo
      • 查詢支持的時鐘速率
        • nvidia-smi --query-supported-clocks=timestamp,gpu_name,gpu_uuid,memory,graphics --format=csv
      • 要分別設置內核和內存時鐘速率,請執行以下操作:
        • nvidia-smi --lock-gpu-clocks=<core_clock_rate>
        • nvidia-smi --lock-memory-clocks=<memory_clock_rate>
      • 執行性能捕獲或其他工作。
      • 要分別重置核心和內存時鐘速率,請執行以下操作:
        • nvidia-smi --reset-gpu-clocks
        • nvidia-smi --reset-memory-clocks
      • 對于項目期間的一般使用,可以編寫一個簡單的腳本來鎖定時鐘、啟動應用程序,然后在退出后重置時鐘。
      • 要獲得命令行幫助,請運行nvidia-smi --help。為方便起見,前面列出的命令有一些簡短版本。
    • 使用 DX12 功能SetStablePowerState讀取 GPU 預定的穩定電源時鐘頻率。穩定的 GPU 時鐘頻率可能因板而異。
      • 修改 DX12 示例以調用SetStablePowerState
      • 執行nvidia-smi -q -d CLOCK,并在SetStablePowerState樣本運行時記錄圖形時鐘頻率。將此頻率與--lock-gpu-clocks選項一起使用。
    • 使用 Nsight Graphics 的 GPU 跟蹤活動,并選擇在評測期間鎖定內核和內存時鐘速率(圖 1 )。
    Screenshot of Nsight Graphics UI with Locks Clocks to Base checkbox.
    圖 1 :。“將時鐘鎖定到基準”復選框

    不推薦使用

    • 請勿僅使用 DX12 的SetStablePowerState功能鎖定 GPU 核心時鐘。這不會鎖定內存時鐘,結果也不如nvidia-smi可實現的那樣具有可比性。


    0

    標簽

    人人超碰97caoporen国产