開發工具& amp ;圖書館 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 12 Sep 2023 06:13:50 +0000 zh-CN hourly 1 196178272 NVIDIA CUDA 工具包符號服務器 http://www.open-lab.net/zh-cn/blog/cuda-toolkit-symbol-server/ Thu, 07 Sep 2023 06:11:55 +0000 http://www.open-lab.net/zh-cn/blog/?p=7846 Continued]]> NVIDIA 已經提供了 Windows 系統的 GPU 驅動程序二進制符號服務器。現在,NVIDIA 也開始提供 Linux 系統的 CUDA Toolkit 符號。 NVIDIA 正在為 Linux 引入 CUDA Toolkit 符號,以增強應用程序開發功能。在應用程序開發過程中,您現在可以下載正在應用程序中調試或分析的 NVIDIA 庫的模糊符號。這是 CUDA 驅動程序的初始裝運(lib CUDA .so)和 CUDA 運行時(libcudart.so),將添加更多庫。 例如,當問題似乎與 CUDA neneneba API 有關時,可能并不總是能夠向 NVIDIA 提供具有所有庫加載信息的再現示例、核心轉儲或未同步堆棧跟蹤。提供符號化的調用堆棧可以幫助加快調試過程。 我們只是托管符號文件,所以調試數據不會被分發。符號文件包含模糊的符號名稱。

Source

]]>
7846
使用 NVIDIA Compute Sanitizer 更有效地調試 CUDA http://www.open-lab.net/zh-cn/blog/debugging-cuda-more-efficiently-with-nvidia-compute-sanitizer/ Thu, 29 Jun 2023 04:04:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=7380 Continued]]> 調試代碼是軟件開發的關鍵方面,但可能具有挑戰性且耗時。并行編程可以為已經很復雜的調試過程引入新的維度,其中可以同時處理數千個線程。 開發人員可以使用各種工具和技術來幫助使調試變得更簡單、更高效。本文介紹了一種調試工具:NVIDIA Compute Sanitizer。我們將探索這些功能,并通過示例向您展示它的用途,以便您可以在調試過程中節省時間和精力,同時提高 CUDA 應用程序的可靠性和性能。 Compute Sanitizer 隨CUDA Toolkit一起捆綁。 Compute Sanitizer 是一套工具,可以對代碼的功能正確性執行不同類型的檢查。調試的一個關鍵挑戰是找到錯誤的根本原因,解決它通常比追蹤它更容易,尤其是在并行執行環境中,因為在這種環境中,錯誤的來源可能是瞬態的。 Compute Sanitizer 通過檢查代碼是否存在內存訪問違規、

Source

]]>
7380
使用 RAPIDS-singlecell 進行 GPU 加速的單細胞 RNA 分析 http://www.open-lab.net/zh-cn/blog/gpu-accelerated-single-cell-rna-analysis-with-rapids-singlecell/ Tue, 27 Jun 2023 06:19:06 +0000 http://www.open-lab.net/zh-cn/blog/?p=7268 Continued]]> 單細胞測序已成為生物醫學研究中最突出的技術之一。它在細胞水平上破譯轉錄組和表觀基因組變化的能力使研究人員獲得了有價值的新見解。因此,單細胞實驗的規模和復雜性增加了 100 多倍,涉及 100 多萬個細胞的實驗越來越普遍。 但是,必須在高度迭代的過程中對結果數據進行分析。至關重要的是,快速算法用于這些迭代步驟,以實現快速周轉時間。 為了使用 Python 進行更一致的單細胞分析,scverse致力于構建一個完整的生態系統,以幫助研究人員進行分析。該生態系統的核心是一種數據結構,它可以在整個數據處理管道中維護各種轉換的注釋,從而實現單細胞分析。 AnnData 是一個 Python 包,用于處理內存和磁盤上的注釋數據矩陣,是 Scanpy 庫,是 scverse 生態系統中的主要單細胞分析套件。Scanpy 構建在 PyData 生態系統中常見的其他庫之上,如 NumPy 、

Source

]]>
7268
使用 Spark 3.4 簡化分布式深度學習 http://www.open-lab.net/zh-cn/blog/distributed-deep-learning-made-easy-with-spark-3-4/ Mon, 12 Jun 2023 05:23:45 +0000 http://www.open-lab.net/zh-cn/blog/?p=7219 Continued]]> Apache Spark是一個業界領先的平臺,用于大規模數據的分布式提取、轉換和加載( ETL )工作負載。隨著深度學習( DL )的發展,許多 Spark 從業者試圖將 DL 模型添加到他們的數據處理管道中,以涵蓋各種用例,如銷售預測、內容推薦、情緒分析和欺詐檢測。 然而,結合 DL 培訓和推理,從歷史上看,大規模數據一直是 Spark 用戶面臨的挑戰。大多數 DL 框架都是為單節點環境設計的,它們的分布式訓練和推理 API 通常是經過深思熟慮后添加的。 為了解決單節點 DL 環境和大規模分布式環境之間的脫節,有多種第三方解決方案,如 Horovod-on-Spark、TensorFlowOnSpark 和 SparkTorch,但由于這些解決方案不是在 Spark 中本地構建的,因此用戶必須根據自己的需求評估每個平臺。 隨著 Spark 3.4 的發布,

Source

]]>
7219
基于遞歸神經網絡和 XGBoost 的時間序列模型預測信用違約 http://www.open-lab.net/zh-cn/blog/predicting-credit-defaults-using-time-series-models-with-recursive-neural-networks-and-xgboost/ Wed, 07 Jun 2023 06:34:54 +0000 http://www.open-lab.net/zh-cn/blog/?p=7151 Continued]]> 今天的機器學習( ML )解決方案很復雜,很少只使用一個模型。有效地訓練模型需要大量多樣的數據集,這些數據集可能需要多個模型才能有效地進行預測。此外,在生產中部署復雜的多模型 ML 解決方案可能是一項具有挑戰性的任務。一個常見的例子是,不同框架的兼容性問題可能導致見解延遲。 一個易于服務于深度神經網絡和基于樹的模型的各種組合并且與框架無關的解決方案將有助于簡化 ML 解決方案的部署,并在 ML 解決方案采用多層時對其進行擴展。 本文將討論如何利用 NVIDIA 軟件的多功能性處理不同類型的模型,并將它們集成到應用程序中。我將演示 NVIDIA RAPIDS 如何支持大型數據集的數據準備和 ML 訓練,以及如何NVIDIA Triton Inference Server無縫服務于兩個深度神經網絡PyTorch和基于樹的模XGBoost,用于預測信用違約。

Source

]]>
7151
人人超碰97caoporen国产