消息 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 27 Feb 2024 23:11:20 +0000 zh-CN hourly 1 196178272 NVIDIA NeMo ASR 發布了對荷蘭語和波斯語的新支持 http://www.open-lab.net/zh-cn/blog/new-support-for-dutch-and-persian-released-by-nemo-asr/ Tue, 16 Jan 2024 06:28:44 +0000 http://www.open-lab.net/zh-cn/blog/?p=8754 Continued]]> 為了打破語音識別的障礙,NVIDIA NeMo自豪地推出了專為 AI 領域中常被忽視的荷蘭語和波斯語設計的預訓練模型。 這些模型采用了最新推出的 FastConformer 技術,并結合 CTC 和傳感器目標進行同步訓練,以最大程度提升每個模型的準確性。 自動語音識別(ASR)是對話式 AI 應用的基礎技術,因為它使用戶能夠使用語音與 AI 系統和其他設備進行通信。它還廣泛用于對話式分析和音頻字幕,從而實現更廣泛的內容訪問。 Persian 模型基于 Mozilla 的 Common Voice (MCV) 15.0 波斯數據構建。值得注意的是,兩種技術對于提高模型性能至關重要:一是從預訓練的英語檢查點初始化,二是自定義訓練測試分割,這允許額外使用 300 小時的 MCV 驗證記錄。 此模型在評估中實現了 13.16%的詞錯誤率 (WER) 和 3.85%

Source

]]>
8754
借助 NVIDIA Maxine 體驗實時音頻和視頻通信 http://www.open-lab.net/zh-cn/blog/experience-real-time-audio-and-video-communication-with-nvidia-maxine/ Wed, 10 Jan 2024 05:21:11 +0000 http://www.open-lab.net/zh-cn/blog/?p=8643 Continued]]> 我們的 NVIDIA Maxine 開發者平臺通過為開發者和企業提供各種低代碼實施方案,重新定義了視頻會議和編輯。其中包括 GPU 加速的 AI 微服務、SDK 和 NVIDIA 托管的 API 端點,用于實時 AI 增強音頻和視頻流。 最新版本的 Maxine 開發者平臺帶來了語音字體功能的搶先體驗、實時肖像視頻的改進,以及 Maxine 眼神交流功能的升級。此外,Video Live Portrait 和 Voice 字體功能現已在 NVIDIA NGC 目錄 中提供。您現在可以在 NVIDIA 加速的云基礎設施上,體驗 Maxine 預訓練的生成式 AI 模型的實際應用。 NVIDIA AI 基礎模型 Maxine 等公司展示了企業現在如何連接其應用,以讀取和集成 NVIDIA Foundations API 端點,并快速創建和部署性能優化的 AI 模型,

Source

]]>
8643
借助 NVIDIA RTX 系統為 Windows PC 上的 LLM 應用程序提供強效助力 http://www.open-lab.net/zh-cn/blog/supercharging-llm-applications-on-windows-pcs-with-nvidia-rtx-systems/ Mon, 08 Jan 2024 05:52:26 +0000 http://www.open-lab.net/zh-cn/blog/?p=8666 Continued]]> 大型語言模型 (LLM) 正在從根本上改變我們與計算機的交互方式。從互聯網搜索到辦公效率工具,這些模型正被整合到各種應用中。它們正在推進實時內容生成、文本摘要、客戶服務聊天機器人和問答用例的發展。 如今,由 LLM 提供支持的應用程序主要在云端運行。但是,許多用例都將受益于在 Windows PC 上本地運行 LLM,包括游戲、創意、生產力和開發者體驗。 在 CES 2024 上, NVIDIA 發布了一些開發者工具,用于在適用于 Windows PC 的 NVIDIA RTX 系統上加速 LLM 推理和開發。您現在可以使用 NVIDIA 端到端開發者工具在 NVIDIA RTX AI 就緒型 PC 上創建和部署 LLM 應用。 NVIDIA 剛剛宣布為熱門社區模型提供優化支持,包括 Phi-2。除了在 NVIDIA RTX 系統上對 Lama2、

Source

]]>
8666
使用 NVIDIA TensorRT 加速的全新 Stable Diffusion 模型 http://www.open-lab.net/zh-cn/blog/new-stable-diffusion-models-accelerated-with-nvidia-tensorrt/ Mon, 08 Jan 2024 05:41:51 +0000 http://www.open-lab.net/zh-cn/blog/?p=8661 Continued]]> 在 CES 上, NVIDIA 分享道,SDXL Turbo、LCM-LoRA 和 Stable Video Diffusion 均由 NVIDIA TensorRT 加速。這些增強功能使 GeForce RTX GPU 用戶能夠實時生成圖像,并節省生成視頻的時間,從而大幅改善工作流程。 SDXL Turbo 利用新的蒸餾技術實現先進的性能,能夠實現單步圖像生成。由 Tensor Core 和 TensorRT 加速的 NVIDIA 硬件每秒可生成多達四張圖像,使您能夠首次體驗到實時 SDXL 圖像生成功能。有關非商業用途和商業用途的更多信息,請參閱 Stability AI 會員資格 頁面。 下載 SDXL Turbo 模型以生成面部表情。 Low-Rank Adaptation (LoRA) 是一種用于微調 Stable Diffusion…

Source

]]>
8661
新模型 MolMIM 和 DiffDock 助力 NVIDIA BioNeMo 中的分子生成和分子對接 http://www.open-lab.net/zh-cn/blog/new-models-molmim-and-diffdock-power-molecule-generation-and-molecular-docking-in-bionemo/ Mon, 08 Jan 2024 05:36:43 +0000 http://www.open-lab.net/zh-cn/blog/?p=8655 Continued]]> 在科學、技術和醫學的交叉領域,尋找可行的藥物是最艱巨的挑戰之一。從數學上講,隨機偶然發現一個好的治療候選者的可能性小得驚人。這主要是因為只有幾個原子可以通過大量的方法連接在一起,使初看起來像藥物一樣的化合物。 在對這些分子進行更深入的檢查后,絕大多數分子都會成為不適合的治療方法。臨床上可行的藥物必須具有多種特性或特性,如果缺少其中任何一種特性或特性或超出范圍,則可能會使藥物無效,甚至有毒。藥物獵人尋求的特性示例包括描述藥物的結合親和力、溶劑性、膜滲透性、分子量和穩定性的特性,等等。 從本質上講,候選藥物的追求是多目標優化問題。 生成式 AI 模型,例如 NVIDIA BioNeMo 中的 MolMIM,旨在直接解決尋找具有正確屬性的分子的挑戰。使用 MolMIM,研究人員可以生成分子,以最大限度地提高用戶指定的評分函數(簡稱 Oracle 函數)。

Source

]]>
8655
問答:電影場景中的實時光線追蹤 http://www.open-lab.net/zh-cn/blog/qa-real-time-ray-tracing-in-a-cinematic-scene/ Wed, 20 Dec 2023 04:33:09 +0000 http://www.open-lab.net/zh-cn/blog/?p=8539 Continued]]> 六年前,實時光線追蹤被視為白日夢。當時,電影級渲染需要計算機農場在一夜之間緩慢烘焙每幀圖像,這是一個艱苦的過程。 到 2018 年,這一性能水平可以實時實現,達到每秒 45 幀,使視頻游戲等應用程序能夠在圖形質量方面實現巨大飛躍。 作為我們 RTX 500 慶典 的一部分,我們想回顧一下 NVIDIA 的 Project Sol。這個實時電影級系列展示了視覺效果,其保真度達到了觀眾在高端動畫電影中才能看到的水平。請在下面查看: 該系列的其他視頻 視頻 – Project Sol 第 2 部分:由 NVIDIA RTX 支持的實時光線追蹤電影級場景 視頻 – Project Sol 第 3 部分:由 NVIDIA RTX 支持的實時光線追蹤電影級場景 我們最近關注了 Gabriele Leone,他是 NVIDIA 的高級設計總監,

Source

]]>
8539
2023 年最熱門的 NVIDIA 技術博客文章:生成式 AI、LLM、機器人開發和虛擬世界的突破 http://www.open-lab.net/zh-cn/blog/year-in-review-trending-posts-of-2023/ Tue, 19 Dec 2023 04:58:25 +0000 http://www.open-lab.net/zh-cn/blog/?p=8555 Continued]]> 在 NVIDIA 激動人心的又一年即將結束之際,是時候回顧 2023 年 NVIDIA 技術博客中最熱門的案例了。 生成式 AI、大型語言模型 (LLM)、高性能計算 (HPC) 和機器人等領域的突破性研究和開發正在引領變革性 AI 解決方案的發展,并吸引了讀者的興趣。其他熱門文章探討了視頻技術和視頻會議領域的進步、增強用戶體驗以及 AI 安全方面的突破。 以下是 2023 年的部分亮點。 借助生成式 AI 快速生成虛擬世界的 3D 素材 NVIDIA Omniverse 上的新生成式 AI 技術增強了虛擬環境中的 3D 素材創建。這些進步旨在使元宇宙中的虛擬世界創建更快、更輕松。 利用 NVIDIA Maxine 眼神交流功能,增強視頻會議中的人際互動 NVIDIA Maxine 眼神交流技術利用 AI 實時調整您對攝像頭的注視點,

Source

]]>
8555
使用 Trajeglish 幫助自動駕駛汽車學習人類駕駛行為語言 http://www.open-lab.net/zh-cn/blog/teaching-avs-the-language-of-human-driving-behavior-with-trajeglish/ Mon, 18 Dec 2023 04:08:32 +0000 http://www.open-lab.net/zh-cn/blog/?p=8513 Continued]]> 駕駛員之間的溝通常常遠超于轉向燈和剎車燈的使用,很多情況下都依賴于人與人之間的交流,而并非汽車技術,比如,示意另一輛車繼續前行、觀察另一位駕駛員是否注意到了自己、友好地向對面的車揮手等。 在不久的將來,自動駕駛汽車(AV)必將與人類駕駛員共存,因此它們需要能夠理解這種行為,才能做出不阻礙交通的安全決策。 為了在訓練中解決這一挑戰,開發者必須能夠預測其他車輛的未來運動會如何受到自動駕駛汽車行動的影響。NVIDIA Research團隊在最近發表的一篇論文中介紹了一種交通建模方法——Trajeglish,其能夠以語言模型對單詞和短語進行標記的方式,來對車輛運動進行標記化處理,以此實現逼真的多車輛駕駛場景仿真。 在 Waymo 仿真智能體挑戰賽(Waymo Sim Agents Challenge)的第一輪(V0)中,與其他16個交通模型相比,

Source

]]>
8513
借助寶馬集團和 NVIDIA cuQuantum 對量子計算應用程序進行基準測試 http://www.open-lab.net/zh-cn/blog/benchmarking-quantum-computing-applications-with-bmw-group-and-nvidia-cuquantum/ Tue, 12 Dec 2023 04:41:20 +0000 http://www.open-lab.net/zh-cn/blog/?p=8479 Continued]]> 從復雜系統的數值模擬和優化到機器學習 (ML),量子計算有可能徹底改變行業的各個方面。汽車行業的許多計算挑戰非常適合量子計算,包括新型材料的開發、高效的部件設計、優化制造流程和準確的風險預測。 NVIDIA Omniverse GPU 的優勢在于NVIDIA cuQuantum,這是一個用于加速量子電路模擬的 SDK。而寶馬集團最近發表了一項關于面向應用的量子機器學習基準測試的研究。 目前,該小組正在研究量子計算如何增強生成建模中的算法。他們觀察到,使用 cuQuantum 時,模擬性能提高了 300 倍,從每次迭代 8 小時提高到幾分鐘。 生成式 AI 是一種 ML 技術,其中算法被訓練以創建類似于其訓練數據的新數據樣本。它常用于圖像生成、文本轉語音等任務,以及旨在生成新內容的其他應用。ML 中的量子方法可以幫助生成針對特定參數優化的設計,從而實現更快、

Source

]]>
8479
使用神經運算符進行新一代地震監測 http://www.open-lab.net/zh-cn/blog/next-generation-seismic-monitoring-with-neural-operators/ Tue, 12 Dec 2023 04:31:27 +0000 http://www.open-lab.net/zh-cn/blog/?p=8475 Continued]]> 虛擬地震學才出現幾年,并且已經對地震監測產生了重大影響。 過去,地震相位拾取是一項使用地震波到達時間標記地震圖的任務,地震波到達時間是全球地震監測操作的基礎。因此,它需要大量勞動力,充滿主觀性,并且容易出錯。 由 NVIDIA GPU 支持的深度學習技術已經克服了這些挑戰。我們的論文 用于地震到達點多工作站揀貨的相位神經運算符 引入了一種新的通用網絡范圍的相位選擇算法。該算法基于最近開發的一種名為神經運算符的機器學習范式。我們的模型,命名為 PhaseNO,利用時空上下文信息,能夠為任何地震網絡幾何圖形同時選擇相位。 借助 NVIDIA DGX GPU 加速的 PhaseNO 扎根于地震學領域,證明了神經運算符在革新地震相位選擇方法方面的變革性潛力,從而開啟了科學計算的新篇章。 地震檢測和相位拾取是地震地震學的基礎任務,其目的是在連續數據中識別地震,

Source

]]>
8475
NVIDIA 研究團隊在 SIGGRAPH Asia Real-Time Live 上展示采用 Gen AI 的交互式紋理繪畫 http://www.open-lab.net/zh-cn/blog/nvidia-research-shows-interactive-texture-painting-with-gen-ai-at-siggraph-asia-real-time-live/ Mon, 11 Dec 2023 04:53:02 +0000 http://www.open-lab.net/zh-cn/blog/?p=8486 Continued]]> NVIDIA 研究人員在 SIGGRAPH 亞洲實時直播 活動中,展示了集成到交互式紋理繪制工作流程中的生成式 AI 技術。這項技術使藝術家能夠直接在 3D 物體表面上繪制復雜、獨一無二的紋理。 此原型展示了 AI 如何作為藝術家手中的畫筆,而不僅僅是在高級用戶的指導下生成完整的結果。它支持交互式地添加具有無限紋理變化和逼真過渡的局部細節。如果您錯過了直播節目,請查看預錄制版本的演示。 這是 NVIDIA 一系列研究項目中的一項,旨在通過實時 AI 推理和直接控制來開發新的迭代工作流,利用 AI 的強大功能支持創造力。SIGGRAPH 大會上的 AI 通用材質在 2023 年 8 月贏得了 Real-Time Live 節目獎項。 AI 紋理繪畫使 AI 在交互式循環中更進一步。此項目使您能夠通過交互式繪畫直接控制紋理的位置、比例和方向,

Source

]]>
8486
借助 NVIDIA TAO 為數萬億臺設備開發和優化視覺 AI 模型 http://www.open-lab.net/zh-cn/blog/develop-and-optimize-vision-ai-models-for-trillions-of-devices-with-nvidia-tao/ Wed, 06 Dec 2023 05:18:42 +0000 http://www.open-lab.net/zh-cn/blog/?p=8409 Continued]]> 全球的開發者正在利用 NVIDIA TAO 工具套件 構建 AI 驅動的視覺感知和計算機視覺應用程序。現在,得益于該平臺的顯著增強和強大的生態系統支持,這一過程變得比以往更快、更簡單。 NVIDIA TAO 工具套件 支持超過 10 種計算機視覺和視覺 AI 模型,包括圖像分類、物體檢測、三種類型的分割、光學字符識別 (OCR)、動作識別、關鍵點估計、身體姿態估計、嵌入模型、連體網絡等。 TAO 工具套件的入門速度比以往更快,支持超過 NVIDIA NGC 上的 40 個預訓練模型。利用 TAO 的方法可以隨著用于調整各行各業模型的工作流而不斷擴展。如需了解詳情,請參閱 借助 NVIDIA TAO 和視覺 AI 模型變革工業缺陷檢測 和 自定義 AI 模型:使用 NVIDIA TAO 訓練角色檢測和識別模型。 TAO 的下載量已超過 10 萬次,

Source

]]>
8409
使用自監督學習重建動態駕駛場景 http://www.open-lab.net/zh-cn/blog/reconstructing-dynamic-driving-scenarios-using-self-supervised-learning/ Tue, 05 Dec 2023 05:26:42 +0000 http://www.open-lab.net/zh-cn/blog/?p=8412 Continued]]> 從單調乏味的高速公路到日常的社區出行,駕駛通常都很平靜。因此,在現實世界中收集的大部分自動駕駛汽車 (AV) 開發訓練數據嚴重傾斜于簡單的場景。 這給部署穩健的感知模型帶來了挑戰。AV 必須經過全面的訓練、測試和驗證,才能處理復雜的情況,而這需要涵蓋此類情況的大量數據。 模擬為在現實世界中查找和收集此類數據提供了一種替代方案,而這需要非常耗時和成本。然而,大規模生成復雜的動態場景仍然是一個重大障礙。 在最近發表的一篇論文中,NVIDIA Research 展示了一種新的基于神經輻射場(NeRF)的方法(稱為 EmerNeRF),它如何使用自監督學習準確生成動態場景。通過自監督進行訓練,EmerNeRF 不僅在處理動態對象時優于其他基于 NeRF 的方法,而且在處理靜態場景時也表現出色。有關更多詳情,請參閱 EmerNeRF:通過自監督對緊急時空場景進行分解。

Source

]]>
8412
CUDA Quantum 0.5 為量子經典計算提供新功能 http://www.open-lab.net/zh-cn/blog/cuda-quantum-0-5-delivers-new-features-for-quantum-classical-computing/ Wed, 29 Nov 2023 06:16:24 +0000 http://www.open-lab.net/zh-cn/blog/?p=8352 Continued]]> CUDA 量子 是一個用于構建量子經典計算應用的平臺。它是一種開源編程模型,適用于異構計算,例如 量子處理器單元 (QPU)、GPU 和 CPU。 CUDA Quantum 可加速量子模擬、量子機器學習、量子化學等工作流程。它可優化作為其編譯器工具鏈一部分的這些工作流程,并利用 GPU 的強大功能來加速這些工作流程。CUDA Quantum 提供基于內核的編程,可與 Python 或 C++一起使用。 最新版本的 CUDA Quantum 0.5 引入了更多的 QPU 后端、增強的模擬器功能以及其他改進。欲了解更多信息,請參閱CUDA Quantum 0.5 版本說明。 量子糾錯和其他形式的混合量子-經典計算通常需要非凡的控制流和緊密交織的基元。CUDA Quantum 現在支持運行自適應量子內核,這是實現真正集成的量子-經典編程的關鍵一步。詳情請參閱:規格。

Source

]]>
8352
借助 NVIDIA Base Command Platform 簡化作業初始化和基于 CPU 的任務 http://www.open-lab.net/zh-cn/blog/streamline-job-initialization-and-cpu-based-tasks-with-nvidia-base-command-platform/ Wed, 29 Nov 2023 06:12:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=8349 Continued]]> NVIDIA Base Command 平臺 提供了日益精簡的軟件服務工作流程,旨在加速 AI 開發。本文將介紹近期添加的一些新功能,包括: 在超級計算機上啟動探索環境從未如此簡單。 借助“Quick Start”(快速啟動)功能,團隊可以以編程方式定義其常用配置,從 GPU 和 CPU 實例類型、內存和存儲需求到添加數據集、工作空間、交換容器,甚至設置默認命令。這些都定義為一個模板,只需在 Base Command 控制面板中單擊一下即可啟動。 除了自己構建模板外,您還可以利用 NVIDIA 構建的快速入門目錄。JupyterLab 和 Dask+RAPIDS 的默認快速入門現已推出。隨著目錄的不斷發展,數據科學家現在使用的各種工具集將更易于使用 GPU 加速的數據科學。 軟件和硬件的深度集成是 Base Command Platform 的核心原則,

Source

]]>
8349
人人超碰97caoporen国产