Image Processing – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 13 Apr 2023 04:45:11 +0000 zh-CN hourly 1 196178272 都市聚焦: Lumeo 簡化視覺 AI 開發 http://www.open-lab.net/zh-cn/blog/metropolis-spotlight-lumeo-simplifies-vision-ai-development/ Wed, 12 Apr 2023 01:54:27 +0000 http://www.open-lab.net/zh-cn/blog/?p=6645 Continued]]> 全球最重要的空間部署了超過 10 億臺攝像機,這些攝像機是視頻和數據的關鍵來源。了解如何利用這些數據來提高我們的空間和流程的效率和安全性變得越來越重要。 Lumeo, NVIDIA Metropolis 合作伙伴,提供了一個“無代碼”視頻分析平臺,使開發人員和解決方案提供商能夠在幾分鐘內在邊緣或云中創建和交付自定義分析。它通過基于 web 的拖放工具、預先構建的分析構建塊、即用型和自定義人工智能模型以及與云服務的集成來實現這一點。 Lumeo 的平臺建立在NVIDIA pretrained models,NVIDIA TAO Toolkit,以及NVIDIA DeepStream SDK,為視覺人工智能解決方案的市場化鋪平了最快的道路。您可以使用任何 NVIDIA GPU 或 NVIDIA Jetson 邊緣 AI 系統在本地或云中快速部署和擴展定制的解決方案,

Source

]]>
6645
在 VR 中使用 NVIDIA Instant NeRF 將 2D 圖像轉換為沉浸式 3D 場景 http://www.open-lab.net/zh-cn/blog/turn-2d-images-into-immersive-3d-scenes-with-nvidia-instant-nerf-in-vr/ Tue, 31 Jan 2023 07:16:18 +0000 http://www.open-lab.net/zh-cn/blog/?p=6122 Continued]]> 數千名開發人員和內容創作者使用 NVIDIA Instant NeRF 構建了令人驚嘆的 3D 視覺效果,這是一種將一組靜態圖像轉換為真實 3D 場景的渲染工具。現在,也可以在 VR 中導航 Instant NeRF ,并使用最新的 Instant NeRF software update 進行 3D 創作。 被時代雜志命名為 2022 最佳發明 , Instant NeRF 提供了攝影、 3D 圖形和虛擬世界的未來一瞥。 借助 VR 中的 Instant NeRF ,用戶可以使用 2D 圖像快速創建虛擬場景。使用包括中心凹、動態縮放、 NVIDIA DLSS 和可選的第二個 GPU 在內的高級渲染技術,創作者可以在廣泛的預算范圍內實現所需的幀速率和分辨率目標。 傳統上,創建 3D 和虛擬場景是一個耗時、昂貴的過程,需要專門的設備和專業知識。

Source

]]>
6122
《時代》雜志將 NVIDIA Instant NeRF 評為 2022 年最佳發明 http://www.open-lab.net/zh-cn/blog/time-magazine-names-nvidia-instant-nerf-a-best-invention-of-2022/ Sat, 12 Nov 2022 07:11:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5681 Continued]]> 時代雜志將 NVIDIA 命名為 Instant NeRF ,這是一種能夠將 2D 圖像轉換為 3D 場景的技術,也是 2022 年最佳發明 之一。 “在 NVIDIA Instant NeRF 之前,創建 3D 場景需要專門的設備、專業知識以及大量的時間和金錢。現在只需要幾張照片和幾分鐘,”《時代周刊》在其發布中寫道。 3D 渲染工具在 2022 年 SIGGRAPH 2022 上推出,這是世界上最大的計算機圖形和交互技術會議。 在 SIGGRAPH 上, NVIDIA 研究人員托馬斯·穆勒、亞歷克斯·埃文斯、克里斯托夫·席德和亞歷山大·凱勒提交了他們的論文 Instant Neural Graphics Primitives with a Multiresolution Hash Encoding 。這項創新研究很快受到歡迎,

Source

]]>
5681
AI 模型匹配放射學家在 MRI 中識別乳腺癌的準確性 http://www.open-lab.net/zh-cn/blog/ai-model-matches-radiologists-accuracy-identifying-breast-cancer-in-mris/ Wed, 28 Sep 2022 08:15:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5372 Continued]]> 紐約大學朗根健康學院的研究人員旨在通過一種新的人工智能模型改進乳腺癌診斷。最近發表在 Science Translational Medicine 上的 研究 概述了一個深度學習框架,該框架通過 MRI 預測乳腺癌的準確性與委員會認證的放射科醫生一樣高。這項研究可能有助于創建一個在臨床環境中實施基于人工智能的癌癥診斷模型的基礎框架。 研究資深作者 Krzysztof J. Geras 表示:“乳腺 MRI 檢查很難解釋,即使對于經驗豐富的放射科醫生來說也很耗時。人工智能在改善醫學診斷方面有巨大潛力,因為它可以從成千上萬的檢查中學習。使用人工智能協助放射科醫師可以使過程更準確,并對結果有更高的信心。”, Department of Radiology at the NYU Grossman School of Medicine 的助理教授。 作為乳腺癌診斷的敏感工具,

Source

]]>
5372
教機器用計算機視覺閱讀樂高手冊 http://www.open-lab.net/zh-cn/blog/teaching-machines-to-read-lego-manuals-with-computer-vision/ Thu, 18 Aug 2022 03:16:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4936 Continued]]> 樂高愛好者抓撓他們的頭,閱讀組裝說明,可能很快有助于復雜的建設,感謝一個新的 學習 來自斯坦福大學、麻省理工學院和 Autodesk 。研究人員設計了一個深度學習框架,將 2D 手冊翻譯成機器可以理解的步驟,以構建 3D 樂高套件。這項工作可以推動專注于制造機器的研究,幫助人們組裝物體。 “樂高手冊提供了一個獨立的環境,展示了人類的一項核心技能:在指導下學習完成任務。利用視覺場景解析和程序合成的最新進展,我們旨在構建具有類似技能的機器,從樂高開始,最終以現實世界場景為目標,”該研究資深作者吳家軍說,斯坦福大學計算機科學助理教授。 研究人員表示,用人工智能翻譯 2D 手冊面臨兩大挑戰。首先, AI 必須基于 2D 手動圖像在每個裝配步驟中學習和理解 3D 形狀之間的對應關系。這包括考慮工件的方向和對齊。 它還必須能夠對磚塊進行分類,并在半組裝模型中推斷出磚塊的三維姿態。

Source

]]>
4936
使用多維圖像處理增強圖像分析 http://www.open-lab.net/zh-cn/blog/enhanced-image-analysis-with-multidimensional-image-processing/ Wed, 27 Jul 2022 06:30:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4708 Continued]]> 圖像數據通常可以通過兩個維度(行和列)來描述,可能還有一個額外維度用于紅色、綠色、藍色( RGB )。然而,有時需要進一步的維度,以便在特定應用和領域中進行更準確和詳細的圖像分析。 例如,您可能希望研究三維( 3D )體積,測量兩個零件之間的距離或建模該三維體積隨時間的變化(第四維)。在這些情況下,你需要兩個以上的維度來理解你所看到的。 多維圖像處理,或n– 維度圖像處理,是從具有兩個或多個維度的圖像數據中分析、提取和增強有用信息的廣義術語。它對于醫學成像、遙感、材料科學和顯微鏡應用特別有用和必要。 這些應用中的一些方法可能涉及來自比傳統灰度、 RGB 或紅、綠、藍、 alpha ( RGBA )圖像更多通道的數據。使用具有識別、過濾和分割功能的設備, N 維圖像處理可以幫助您學習并做出明智的決策。 多維圖像處理為您提供了在科學應用中執行傳統二維濾波功能的靈活性。

Source

]]>
4708
使用 Fujifilm Healthcare Cardio StillShot 在任何心率下捕獲 6 倍更好的時間分辨率心臟成像 http://www.open-lab.net/zh-cn/blog/capture-6x-better-temporal-resolution-cardiac-imaging-at-any-heart-rate-with-fujifilm-healthcare-cardio-stillshot/ Tue, 12 Apr 2022 07:42:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3633 Continued]]> 在心臟計算機斷層掃描( CT )成像中,獲取心臟及其血管的清晰診斷圖像是一項挑戰,因為心臟總是在運動,結果圖像可能會模糊。當心臟快速跳動,每分鐘 75 次以上或不規則跳動時,良好的圖像分辨率幾乎是不可能的。 全球診斷成像領導者 Fujifilm Healthcare 開發了 Cardio StillShot 軟件,該軟件使用 NVIDIA GPU ,并與現有的全身 X 射線 CT 系統 SCENARIA View 集成,可在任何心率下進行精確的心臟成像。該軟件無需高速旋轉掃描儀即可改善診斷成像。此外,通過檢測心臟運動并通過運動校正防止圖像模糊, Cardio StillShot 的時間分辨率比傳統圖像重建方法高出 6 倍以上。 清晰的心臟 CT 圖像有助于臨床團隊無創地觀察冠狀動脈、主動脈瓣和心肌等結構,并診斷心力衰竭、心肌病和結構異常等心臟問題。 心血管疾病( CVD…

Source

]]>
3633
使用 DiscoBox DL 框架分割沒有遮罩的對象并減少注釋工作量 http://www.open-lab.net/zh-cn/blog/segment-objects-without-masks-and-reduce-annotation-effort-using-the-discobox-dl-framework/ Thu, 24 Mar 2022 06:35:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3460 Continued]]> 實例分割是檢測和分割目標的一個核心視覺識別問題。在過去幾年中,該領域一直是計算機視覺領域的圣杯之一,其應用范圍廣泛,包括自動駕駛汽車( AV )、機器人技術、視頻分析、智能家居、數字人類和醫療保健。 注釋是對圖像或視頻中的每個對象進行分類的過程,是實例分割的一個具有挑戰性的組成部分。訓練 面具 R-CNN 等傳統實例分割方法需要同時使用對象的類標簽、邊界框和分割遮罩。 然而,獲取分割掩模既昂貴又耗時。例如, 可可數據集 需要大約 70000 小時的時間來注釋 200k 圖像,其中 55000 小時用于收集對象遮罩。 為了加快注釋過程, NVIDIA 研究人員開發了 DiscoBox 框架。該解決方案使用了一種弱監督學習算法,可以在訓練期間輸出高質量的實例分割,而無需掩碼注釋。 該框架直接從邊界框監控生成實例分段,而不是使用掩碼注釋直接監控任務。

Source

]]>
3460
計算機視覺指南:為何重要以及它如何幫助解決問題 http://www.open-lab.net/zh-cn/blog/guide-to-computer-vision-why-it-matters-and-how-it-helps-solve-problems/ Mon, 21 Mar 2022 06:40:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3372 Continued]]> 這篇文章是為了幫助初學者開發社區,尤其是那些對計算機視覺和計算機科學不熟悉的人。NVIDIA 認識到,通過計算機視覺和人工智能解決并受益于世界的視覺計算挑戰需要我們所有人。NVIDIA 很高興與 人工智能中的黑人女性 合作,并將此帖子獻給 人工智能中的黑人女性 。 計算機視覺在現實世界中的應用越來越廣泛,其應用也越來越具有挑戰性,并且正在改變其意義。計算機視覺已經以某種形式存在了幾十年,它正在成為一個越來越常見的短語,遍布世界各地和各個行業:計算機視覺系統、計算機視覺軟件、計算機視覺硬件、計算機視覺開發、計算機視覺管道、計算機視覺技術。 無論從字面上還是比喻上看,計算機視覺的術語和領域都超出了人們的想象。在特定的非人工智能實例中,計算機視覺也被稱為 vision AI 和傳統圖像處理,在制造業和工業用例中也被稱為 machine vision 。 簡言之,

Source

]]>
3372
研究人員利用神經納米光學技術制造了一種鹽粒大小的相機 http://www.open-lab.net/zh-cn/blog/using-neural-nano-optics-researchers-create-a-camera-the-size-of-a-salt-grain/ Thu, 09 Dec 2021 04:27:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2626 Continued]]> 來自普林斯頓和華盛頓大學的一組研究人員創造了一種新的照相機,捕捉到的圖像和測量結果只有一個粗粒鹽大小的半毫米。 發表在 Nature Communications, 上的新的 研究 概述了使用光學超表面和機器學習來產生高質量的彩色圖像,具有廣闊的視野。該設備可用于從機器人到醫療領域的各個行業,以幫助疾病診斷。 光學超表面依賴于一種新的光操縱方法,使用設置在小正方形表面上的圓柱柱。這些柱子的幾何形狀不同,其工作原理類似于天線,可以捕獲入射光子(電磁輻射波)。然后,這些波作為信號從元表面發送到計算機,以解釋并生成圖像。 微型攝像機在醫學上有著巨大的應用潛力,從腦成像到微創內窺鏡。但是,到目前為止,這項技術已經用有限的視野捕捉到模糊、扭曲的圖像。 研究人員采用神經納米光學技術,將光學超表面與基于神經特征的圖像重建相結合,

Source

]]>
2626
最新的 NVIDIA OptiX 渲染光線跟蹤的速度比以往任何時候都快 http://www.open-lab.net/zh-cn/blog/latest-nvidia-optix-renders-ray-tracing-faster-than-ever-before/ Mon, 08 Nov 2021 10:30:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2217 Continued]]> NVIDIA OptiX 射線跟蹤引擎是一個可擴展的無縫框架,可在 GPU 上提供最佳的射線跟蹤性能。在今年秋季更新英偉達 OpTIX SDK ,開發人員將能夠利用新的編譯技術,和優越的分層和時間去噪處理更多的射線跟蹤工作負荷,更快。 NVIDIA OptiX 7 . 4 附帶了一項新功能,支持包含多個函數的 OptixModule 對象的并行編譯。工作被表示為從 API 返回的任務對象,可以并發執行以實現并行性。當發現并行機會時,將返回其他任務。線程在 NVIDIA OptiX 之外通過從應用程序管理的線程執行任務來處理。該應用程序可以更容易地將并行工作集成到現有的作業調度器中。 圖 1 。夜晚廢棄的房子,用紅移渲染.圖片由 Daz3D 提供。 NVIDIA OptiX 7 . 4 已將光線有效載荷的大小從 8 個寄存器增加到 32 個寄存器。

Source

]]>
2217
人人超碰97caoporen国产