Development Tools & Libraries – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 19 Mar 2025 08:40:53 +0000
zh-CN
hourly
1
196178272 -
中歐和東歐創業成功指南
http://www.open-lab.net/zh-cn/blog/a-startups-guide-to-success-in-central-and-eastern-europe/
Wed, 03 May 2023 01:58:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=6836
Continued]]>
中東歐作為世界上最重要的新興技術生態系統之一,正在迅速獲得認可。在過去幾年里,高技能的勞動力、政府的支持、與關鍵市場的接近以及創業史都是導致該地區資金大幅增加的因素。反過來,資金的增加導致幾乎每個垂直領域都有數十家充滿活力和競爭力的初創公司。 但該地區的初創企業面臨著一些獨特的挑戰。與鄰近市場的高度競爭、吸引外國投資者的困難以及人才外流都是該地區初創企業必須克服的獨特變量。如果被忽視或處理不當,這些挑戰最終可能會對渴望在全球科技行業取得成功的創新型新公司造成致命影響。 這個中歐和東歐創業成功指南GTC 會議強調了該地區初創企業面臨的最大挑戰,并邀請行業專家提供如何克服這些挑戰的技巧。 由于 YouTube 的服務條款, Dominik 的視頻在 NVIDIA 點播會話回放中不可用,所以我將其包含在本文中。 我們建議查看整個會話以獲得見解,但以下是亮點:
Source
]]>
6836
-
調試混合 Python 和 C 語言堆棧
http://www.open-lab.net/zh-cn/blog/debugging-mixed-python-and-c-language-stack/
Sun, 23 Apr 2023 05:46:07 +0000
http://www.open-lab.net/zh-cn/blog/?p=6793
Continued]]>
調試很困難。跨多種語言調試尤其具有挑戰性,跨設備調試通常需要一個具有不同技能和專業知識的團隊來揭示潛在問題 然而,項目通常需要使用多種語言,以確保必要時的高性能、用戶友好的體驗以及可能的兼容性。不幸的是,沒有一種編程語言能夠提供上述所有功能,這就要求開發人員變得多才多藝。 這篇文章展示了RAPIDS該團隊著手調試多種編程語言,包括使用GDB以識別和解決死鎖。該團隊致力于設計加速和擴展數據科學解決方案的軟件。 這篇文章中的 bug 是RAPIDS 項目這一問題在 2019 年夏天得到了確認和解決。它涉及到一個包含多種編程語言的復雜堆棧,主要是 C 、 C ++和 Python ,以及CUDA對于 GPU 加速度 記錄這個歷史錯誤及其解決方案有幾個目的,包括: 這篇文章中的內容應該有助于你理解這些錯誤是如何表現出來的,以及如何在你自己的工作中解決類似的問題。
Source
]]>
6793
-
在 Nsight Graphics 中從 Range Profiler 遷移到 GPU Trace
http://www.open-lab.net/zh-cn/blog/migrating-from-range-profiler-to-gpu-trace-in-nsight-graphics/
Thu, 20 Apr 2023 05:53:51 +0000
http://www.open-lab.net/zh-cn/blog/?p=6802
Continued]]>
從 Nsight Graphics 2023 . 1 開始, GPU Trace Profiler 是在幀級別評測圖形應用程序的最佳方式。“幀檔案器”活動和“范圍檔案器”工具窗口已被刪除。 別擔心!關鍵分析信息仍然可用,只是以不同的形式提供。這篇文章將指導您完成 GPU Trace 中的步驟,用于 Range Profiler 中每個熟悉的工作流。 在這篇文章中,我回答了以下問題: 以前,要訪問 Range Profiler ,您可能使用了 Frame Profiler 或 Frame Debugger 活動,如圖 1 左側所示。 現在,在啟動應用程序時,選擇 GPU Trace Profiler 選項,如圖 1 右側所示。在公制套件下拉列表中,您可以選擇要顯示在時間軸視圖中的指標。此列表還包括高級模式選項,該選項允許在表格和工具提示中顯示其他度量。
Source
]]>
6802
-
如何管理虛擬環境和自動化 Tox 測試
http://www.open-lab.net/zh-cn/blog/how-to-manage-virtual-environments-and-automate-testing-with-tox/
Tue, 21 Feb 2023 03:09:45 +0000
http://www.open-lab.net/zh-cn/blog/?p=6346
Continued]]>
許多開發人員使用 tox 作為 Python 中標準化和自動化測試的解決方案。然而,僅將該工具用于測試自動化嚴重限制了其功能和您可以實現的全部范圍。例如, tox 也是“它在我的機器上工作”問題的一個很好的解決方案。這有幾個原因,例如: 此外,最重要的是,上面列出的操作可以在 Windows 、 macOS 和 Linux OS 上執行。在本教程中,我將深入探討 tox 的工作原理以及如何使用它來節省寶貴的資源。我還將提供具體的代碼示例來演示如何利用 tox 。 如果你讀了 tox documentation ,并從字面上理解它的意思,你可能會認為 tox 只是一個用來創建虛擬環境的工具,用來安裝測試 Python 包所需的必要依賴項。 該文檔指出,“ tox 旨在自動化和標準化 Python 中的測試。它是簡化 Python 軟件的打包、
Source
]]>
6346
-
NVIDIA Nsight Systems 和 Nsight Graphics 的新版本于 SIGGRAPH 2022 年首次亮相
http://www.open-lab.net/zh-cn/blog/new-releases-of-nvidia-nsight-systems-and-nsight-graphics-debut-at-siggraph-2022/
Wed, 10 Aug 2022 06:04:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4857
Continued]]>
圖形專業人士和研究人員在 SIGGRAPH 2022 年 分享他們的專業知識,了解計算機圖形行業的最新創新。 NVIDIA Developer Tools 很高興成為今年活動的一部分,主辦動手實驗室 使用 Nsight 優化光線跟蹤應用程序 ,并發布新版本 NVIDIA Nsight 系統 和 NVIDIA Nsight 圖形 現在可以下載。 新的 2022.3 版本 Nsight 系統 帶來擴展 Vulkan 支持,同時改善用戶體驗。 Nsight 系統現在支持 Vulkan 視頻 ,用于處理硬件加速視頻文件的 Vulkan 解決方案。在以前版本的 Nsight 系統中, Vulkan 視頻工作負載不會被識別為其占用的較大隊列命令的子集。 通過在 Nsight Systems 2022.3 中的完全集成,
Source
]]>
4857
-
新的 Nsight 圖形和 Nsight 后續版本中的性能提升和增強功能
http://www.open-lab.net/zh-cn/blog/performance-boosts-and-enhanced-features-in-new-nsight-graphics-nsight-aftermath-releases/
Thu, 21 Jul 2022 05:18:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4665
Continued]]>
Nsight Graphics 2022.3 和 Nsight Afters 2022.2 剛剛發布,現在可以下載。 Nsight Graphics 2022.3 版本側重于性能提升、錯誤修復和 Vulkan 改進。 由于更好的遮擋剔除,光線跟蹤加速結構查看器在某些復雜場景中的性能提高了 20 倍。此外,查看器還改進了對大型實例計數的處理,以提高性能并減少具有重復幾何體的場景中的內存使用。 使用新的 VK_KHR_graphics_pipeline_library extension , Vulkan 應用程序現在可以預編譯著色器,并在運行時以顯著降低的成本鏈接它們。這一點很重要,因為大型 3D 圖形應用程序(如游戲)使用了復雜的算法,從而產生了大量著色器。 這些算法通常需要不同的著色器排列,以考慮不同的效果或照明環境。最終結果是數千或幾十萬個著色器,
Source
]]>
4665
-
使用新的 Nsight Compute 改進導航和性能可視化
http://www.open-lab.net/zh-cn/blog/improve-guidance-and-performance-visualization-with-the-new-nsight-compute/
Tue, 31 May 2022 07:29:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4236
Continued]]>
NVIDIA Nsight Compute 是一款用于 CUDA 應用程序的交互式內核分析器。它通過用戶界面和命令行工具提供詳細的性能指標和 API 調試。 Nsight Compute 2022.2 包含擴展支持的環境和工作流程的功能,用于 CUDA 內核評測和優化。 立即下載。>> 以下概述了 Nsight Compute 2022.2 的功能亮點。 使用新的 NVIDIA OptiX acceleration structure viewer ,用戶可以在啟動光線跟蹤管道之前檢查他們構建的結構。加速結構描述渲染場景的幾何體,用于光線跟蹤交點計算。用戶創建這些加速結構, OptiX 將其轉換為內部數據結構。有時,用戶創建的描述很容易出錯,很難理解渲染結果為什么不符合預期,或者是什么限制了性能。 有了這個新功能,用戶可以在三維可視化工具中瀏覽它們,
Source
]]>
4236
-
使用 NVIDIA Nsight Graphics 中的著色器探查器識別著色器限制器
http://www.open-lab.net/zh-cn/blog/identifying-shader-limiters-with-the-shader-profiler-in-nvidia-nsight-graphics/
Mon, 25 Apr 2022 07:15:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3819
Continued]]>
NVIDIA Nsight 圖形 的一個不太出名但很酷的功能是著色器探查器。這使您能夠在著色器中找到熱點,幫助您指導優化工作。它可以讓你深入了解為什么有時候表現不是你喜歡的。 在本文中,我們使用 NVIDIA Nsight 圖形 跟蹤分析工具來識別潛在的限制器,然后使用著色器探查器進行更深入的挖掘,以發現并修復問題。 我們總是建議從 Nsight Graphics GPU 跟蹤工具開始,而不是直接進入著色器探查器。這樣,您就可以了解任何給定 DX12 或 VK 工作負載的性能限制是什么。例如,如果真正的問題是 GPU 利用率低,因為有很多微小的調度,它們之間都有屏障,那么嘗試微調著色器是沒有意義的。 首先,設置與要分析的應用程序的連接。選擇 Connect 并填寫啟動游戲所需的參數(圖 1 )。 選擇GPU Trace 作為活動,
Source
]]>
3819
-
用 Omniverse Code 應用開發虛擬世界的未來
http://www.open-lab.net/zh-cn/blog/develop-the-future-of-virtual-worlds-with-omniverse-code-app/
Tue, 01 Feb 2022 05:59:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2977
Continued]]>
現在,開發人員可以更輕松地使用 Omniverse Code ,這是一款新的 視頻概述 應用程序,可作為開發人員和超級用戶的集成開發環境( IDE )。 使用 Omniverse Code ,現在處于測試階段,開發人員可以在構建自己的應用程序時快速熟悉該平臺 Omniverse 擴展、應用程序或微服務 Omniverse 代碼包括 Omniverse 工具包 SDK 并提供基礎工具、模板和文檔。在一個易于導航的界面中,開發人員在處理自己基于 Omniverse 的項目時,可以輕松體驗 Omniverse 工具包 SDK 的強大功能。 使用 Omniverse 代碼時,無需從頭開始構建。開發者可以訪問數百個 Omniverse 擴展來編輯、修改或集成到自己的擴展或應用程序中。 該平臺非常模塊化,易于擴展和靈活。用戶可以梳理擴展,將其用作模板,或在現有擴展的基礎上構建功能集。
Source
]]>
2977
-
NVIDIA Nsight Systems 2022.1 引入了 Vulkan 1.3 和 Linux 回溯采樣和分析改進
http://www.open-lab.net/zh-cn/blog/nvidia-nsight-systems-2022-1-introduces-vulkan-1-3-and-linux-backtrace-sampling-and-profiling-improvements/
Tue, 25 Jan 2022 07:22:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2898
Continued]]>
NVIDIA Nsight 系統 是一種性能分析工具,旨在幫助開發人員在 CPU 和 GPU 之間調整和擴展軟件。該工具的最新更新現可下載 。 Nsight Systems 2022.1 引入了一些旨在增強評測體驗的改進。 Nsight Systems 是強大的調試和評測 NVIDIA Nsight 工具套件 的一部分。開發人員可以從 Nsight Systems 開始查看整個系統,避免基于假設和誤報指標選擇效率較低的優化。 使用 Vulkan 1.3 ,您現在可以訪問近 24 個新的擴展。一些擴展,比如 VK _ KHR _ dynamic _ rendering ,可以幫助您簡化代碼,同時提高可讀性。 其他擴展,如 VK _ KHR _ shader _ integer _ dot _ product 或 VK _ EXT…
Source
]]>
2898
-
NVIDIA GTC : Nsight 開發工具的完整概述
http://www.open-lab.net/zh-cn/blog/nvidia-gtc-a-complete-overview-of-nsight-developer-tools/
Wed, 10 Nov 2021 06:43:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2309
Continued]]>
Nsight 開發工具套件提供深入的跟蹤、調試、評測和其他分析,以優化跨 NVIDIA GPU 和 CPU 的復雜計算應用程序,包括 x86 、 Arm 和 Power 體系結構。 NVIDIA Nsight Systems 是一種性能分析工具,旨在可視化、分析和優化編程模型,并在 CPU 和 GPU 的任何數量或大小上進行有效調整以實現規模擴展;從工作站到超級計算機。 Nsight Systems 2021 . 5 的亮點包括: 了解更多 和 下載 >> NVIDIA Nsight Compute 2021.3 發布了用于測量和建模占用率、源代碼和匯編代碼相關性的新功能,以及用于識別訪問緩存造成的瓶頸的分層屋頂線模型。 主要特點: 還有其他改進,包括更多可配置的基線比較、從 CLI 訪問源代碼級信息以及其他 SSH 功能。 下載 >>…
Source
]]>
2309
-
使用 NVIDIA Nsight Deep Learning Designer 設計深度學習應用程序
http://www.open-lab.net/zh-cn/blog/designing-deep-learning-applications-with-nsight-dl-designer/
Wed, 10 Nov 2021 05:34:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2299
Continued]]>
NVIDIA Nsight Deep Learning Designer 是一款新工具,有助于簡化性能模型設計過程。 DL Designer 對模型的結構以及它在 NVIDIA 硬件上的性能提供了有價值的見解。可以使用用戶友好的拖放界面創建模型,該界面具有最流行的深度學習框架中所有常用操作符的節點。 從一開始就必須了解模型的性能特征。設計模型后,可以對其進行性能分析。 要選擇并查看最新的分析報告,請選擇發射推斷,看法,推理運行記錄器. 這分為兩個主要部分。如前所示,第一個為您提供了一個運算符表、它們的超參數和執行時間。默認情況下,它們是按優化優先級順序列出的(類似于 按優化優先級順序列出內核的方式)。 對于在 NVIDIA 硬件上運行的任何模型,無論是訓練還是推理,一個重要的問題是,“該模型是否使用張量核”?剖面報告的第二部分顯示了張量核的利用情況。
Source
]]>
2299
-
使用 NSight Compute 2021 . 3 優化 GPU 利用率
http://www.open-lab.net/zh-cn/blog/optimizing-gpu-utilization-with-nsight-compute-2021-3/
Mon, 25 Oct 2021 06:22:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=1992
Continued]]>
NVIDIA 發布了最新的 NSight 計算 2021 . 3,它具有用于測量和建模占用率、源代碼和匯編代碼相關性的新功能,以及用于識別訪問緩存造成的瓶頸的分層屋頂線模型。 NSight Compute 2021 . 3 添加了一個新的占用率計算器活動,幫助您了解內核的硬件資源利用率,并建模調整如何影響占用率。 占用率是每個 SM 的活動扭曲與活動扭曲理論最大數量的比率。占用率低可能表示內核太小、工作負載不平衡或資源爭用。所有這些都會限制 GPU 上具有特定可用資源集的內核的性能。 此版本添加了一個高要求的功能,允許直接從命令行從 GUI 中的源頁面訪問信息。通過使用標志,用戶可以在命令行上看到源代碼行、 PTX 行或程序集行以及這些行的收集指標。 在分析收集的數據以及編寫腳本和后期處理結果以進行進一步報告和分析時,此功能提供了額外的靈活性。
Source
]]>
1992
人人超碰97caoporen国产