research – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 13 Apr 2023 03:20:47 +0000 zh-CN hourly 1 196178272 NVIDIA Jetson 月度項目:通過聲音識別鳥類 http://www.open-lab.net/zh-cn/blog/nvidia-jetson-project-of-the-month-recognizing-birds-by-sound/ Mon, 03 Apr 2023 03:17:11 +0000 http://www.open-lab.net/zh-cn/blog/?p=6684 Continued]]> 根據野生鳥類的外表來識別它是一回事。僅僅根據聲音來識別同一只鳥是另一回事。除非你是一個熟練的觀鳥者Big Year,通過聲音識別鳥類可能相當具有挑戰性 德國馬爾堡大學的一組數學、計算機科學和生物學研究人員設計了一種快速識別鳥類和監測當地生物多樣性的方法。他們使用連接到 NVIDIA 的便攜式設備拍攝的錄音Jetson Nano Developer Kit. 根據研究人員的說法Bird@Edge project是一個邊緣人工智能系統,“基于分布式系統中運行的嵌入式邊緣設備,能夠對森林中記錄的聲景進行高效、連續的評估。”要了解更多信息,請參閱Bird@Edge: Bird Species Recognition at the Edge. 使用多個基于 ESP32 的麥克風 (Bird @ Edge 麥克風),研究人員將鳥的聲音傳輸到當地 Bird @ Edge 物種識別站。

Source

]]>
6684
語音識別模型對新領域的受控適應 http://www.open-lab.net/zh-cn/blog/controlled-adaptation-of-speech-recognition-models-to-new-domains/ Fri, 03 Feb 2023 03:13:02 +0000 http://www.open-lab.net/zh-cn/blog/?p=6221 Continued]]> 你有沒有試過在你的口音上微調語音識別系統,結果發現,雖然它能很好地識別你的聲音,但卻無法檢測到別人說的話?這在經過數十萬小時語音訓練的語音識別系統中很常見。 在大規模 自動語音識別 ( ASR )中,系統可能在許多但不是所有場景中都表現良好。例如,在嘈雜的環境中,它可能需要更高的精度。或者,它可能需要為具有濃重口音或獨特方言的用戶進行調整。 在這種情況下,一種簡單的方法是根據特定領域的樣本對模型進行微調。盡管如此,這個過程可能會嚴重損害模型在一般語音上的準確性,因為它會過度填充新的域。 本文提出了一種選擇模型的簡單方法,該模型可以在 adapter modules 和 基于傳感器的語音識別系統 的幫助下平衡普通語音的識別精度,并改進自適應域上的識別。 神經網絡通常由多個模塊組成;例如在語音識別或自然語言處理( NLP )中通常使用的編碼器和解碼器模塊。

Source

]]>
6221
基于熵的字級 ASR 置信度估計方法 http://www.open-lab.net/zh-cn/blog/entropy-based-methods-for-word-level-asr-confidence-estimation/ Fri, 13 Jan 2023 09:16:10 +0000 http://www.open-lab.net/zh-cn/blog/?p=6160 Continued]]> 一旦您有了自動語音識別( ASR )模型預測,您可能還想知道這些預測正確的可能性。這種正確率或置信度通常作為原始預測概率(快速、簡單且可能無用)來衡量。您還可以訓練單獨的模型來估計預測置信度(準確,但復雜且緩慢)。這篇文章解釋了如何使用基于熵的方法實現快速、簡單的單詞級 ASR 置信度估計。 你有沒有見過機器學習模型預測,并想知道這種預測有多準確?您可以根據在類似測試用例中測量的準確度進行猜測。例如,假設您知道 ASR 模型以 10% 的單詞錯誤率( WER )預測錄制語音中的單詞。在這種情況下,您可以預期該模型識別的每個單詞都有 90% 的準確率。 對于某些應用程序來說,這樣的粗略估計可能就足夠了,但如果您想確切地知道哪個單詞更可能正確,哪個單詞不正確呢?這將需要使用超出實際單詞的預測信息,例如從模型接收的準確預測概率。

Source

]]>
6160
用晶體物理學進行 X 射線研究揭示機場行李中的危險 http://www.open-lab.net/zh-cn/blog/x-ray-research-reveals-hazards-in-airport-luggage-using-crystal-physics/ Tue, 06 Dec 2022 04:00:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5983 Continued]]> 以 X 射線為動力的研究旨在瞄準通過機場安檢的偷偷摸摸的危險物質。最近發表在 Scientific Reports 上的 study 提出了一種快速而強大的 X 射線衍射( XRD )技術的新設計,該技術能夠識別潛在威脅。這項工作可能是朝著機場更準確的行李掃描邁出的一大步。 研究作者 Airidas Korolkovas 表示:“我的項目的主要目標是加快這種新的 X 射線成像模式,使其在機場安全方面經濟可行。最終,這種掃描儀可以幫助發現甚至是最具創意的隱藏爆炸物、毒品和違禁品,而不會給操作員帶來過高的成本,也不會給乘客造成延誤。”。他在 iTomography 公司擔任 X 射線物理學家和成像科學家期間進行了部分研究。 作為 NVIDIA Academic Hardware Grant Program 的獲獎者,

Source

]]>
5983
新研究突出了 NVIDIA Clara Parabricks 用于基因組分析的速度和成本節約 http://www.open-lab.net/zh-cn/blog/new-research-highlights-speed-and-cost-savings-of-clara-parabricks-for-genomic-analyses/ Thu, 03 Nov 2022 02:48:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5638 Continued]]> 許多組織正在使用 NVIDIA Clara Parabricks 對大型人群項目、重癥患者、臨床工作流程和癌癥基因組學項目進行快速人類基因組和外顯子分析。他們的工作旨在準確、快速地識別致病變種,與加速的下一代測序以及加速的基因組分析保持同步。 最近, 8 月和 9 月的兩份同行評審的科學出版物強調了 Clara Parabricks 在 de novo 和病原體工作流程中的速度、準確性和成本節約。 普渡大學首席研究員喬瓦娜·卡皮博士和她的團隊試圖了解 Clara Parabricks 相對于瘧疾社區用于變種鑒定的現有方法的性能,以跟蹤瘧疾傳播并使用 1000 個瘧疾基因組監測抗瘧藥物耐藥性。 多年來一直在研究病原體基因組學的 Carpi 博士證明,與 CPU 傳統管道相比,分析速度提高了 27 倍,成本降低了 5 倍,同時準確率達到 99.9% 。瘧疾基因組相對較大(…

Source

]]>
5638
用于數據中心網絡的快速發展的光電芯片 http://www.open-lab.net/zh-cn/blog/evolving-record-fast-optoelectronic-chips-for-data-center-networks/ Wed, 02 Nov 2022 06:19:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5600 Continued]]> 歐洲 plaCMOS project 在超高速硅納米光子學/等離子體學方面的領先研究取得了成功。這個為期 51 個月的項目探索了鐵電材料以提高性能和可靠性。該團隊在光鏈路中使用的關鍵部件(調制器、光電二極管和光開關)方面取得了世界領先的進展。 演示了使用集成在硅上的鈦酸鋇的調制器,并測試了具有 BiCMOS 驅動器的單片集成調制器,最高可達 187GBaud 。生成了鍺光電二極管設計,實現了高達 265GHz 的 3dB 帶寬。鐵電非易失性光學 BTO 開關在閉環控制方案中具有 100 個狀態。 這些開創性的結果已發表在 Nature Photonics 期刊上的文章 A Ferroelectric Multilevel Nonvolatile Photonic Phase Shifter 中。 Nature Electronics 、

Source

]]>
5600
AI 模型匹配放射學家在 MRI 中識別乳腺癌的準確性 http://www.open-lab.net/zh-cn/blog/ai-model-matches-radiologists-accuracy-identifying-breast-cancer-in-mris/ Wed, 28 Sep 2022 08:15:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5372 Continued]]> 紐約大學朗根健康學院的研究人員旨在通過一種新的人工智能模型改進乳腺癌診斷。最近發表在 Science Translational Medicine 上的 研究 概述了一個深度學習框架,該框架通過 MRI 預測乳腺癌的準確性與委員會認證的放射科醫生一樣高。這項研究可能有助于創建一個在臨床環境中實施基于人工智能的癌癥診斷模型的基礎框架。 研究資深作者 Krzysztof J. Geras 表示:“乳腺 MRI 檢查很難解釋,即使對于經驗豐富的放射科醫生來說也很耗時。人工智能在改善醫學診斷方面有巨大潛力,因為它可以從成千上萬的檢查中學習。使用人工智能協助放射科醫師可以使過程更準確,并對結果有更高的信心。”, Department of Radiology at the NYU Grossman School of Medicine 的助理教授。 作為乳腺癌診斷的敏感工具,

Source

]]>
5372
開源醫療 AI 創新隨著 MONAI v1.0 不斷擴展 http://www.open-lab.net/zh-cn/blog/open-source-healthcare-ai-innovation-continues-to-expand-with-monai-1-0/ Wed, 21 Sep 2022 10:12:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5238 Continued]]> 針對醫療成像 AI 生命周期的開發是一個耗時的 和資源高消耗 的過程,通常包括數據采集、計算和培訓時間,以及一組在創建適合您的特定挑戰的模型方面有豐富知識的專家。 Project MONAI , AI 的醫療開放網絡,正在繼續擴展其功能,以幫助簡化這些障礙,無論開發人員從何處開始他們的醫療 AI 工作流。 MONAI 是一個特定領域的開源醫學人工智能框架,推動研究突破,加速人工智能進入臨床影響。它將醫生與數據科學家聯合起來,為醫學 AI 工作流中的深度學習模型和可部署應用程序釋放醫學數據的力量。 MONAI 在數據標記、模型培訓和應用程序部署方面具有特定領域的工具,使您能夠開發、復制和標準化醫療 AI 生命周期。 MONAI v1.0 的發布為開發人員帶來了許多令人興奮的新更新和工具,包括: MONAI 是發展最快的開源平臺,

Source

]]>
5238
使用智能醫院的操作系統大規模部署 AI 模型 http://www.open-lab.net/zh-cn/blog/deploying-ai-models-at-scale-with-an-operating-system-for-smart-hospitals/ Thu, 15 Sep 2022 03:57:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5260 Continued]]> 有大量市場認可的醫療人工智能軟件可用于改善患者護理和醫院運營,但我們尚未看到這些技術在醫療保健領域產生預期的大規模變革。 對于醫療機構來說,采用尖端技術并不是一件小事。它需要在法律、臨床和技術風險與改善患者預后和運營效率的承諾之間取得平衡。 傳統上,采用此類技術的挑戰分為三類:人員、平臺和政策。鑒于深度學習技術的性質和醫療人工智能生態系統的現狀,人工智能采用平臺面臨的挑戰尤其獨特。 大多數深度學習應用程序的范圍都很窄。如果他們偏離了自己的領域,他們可能會表現出不可預測和非直覺的行為。這意味著要實現醫學的大規模變革,我們需要數千個人工智能應用程序。 生產中的每一個人工智能模型都將與實時臨床系統進行信息交流,并做出各種必須進行管理的推斷。這有可能創造一個“人工智能叢林”,在一個沒有大量人力投資來管理此類風險的環境中,有大量的技術債務。

Source

]]>
5260
使用 NVIDIA Kaolin Wisp 研究神經場 http://www.open-lab.net/zh-cn/blog/research-neural-fields-your-way-with-nvidia-kaolin-wisp/ Wed, 03 Aug 2022 02:31:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4762 Continued]]> 研究 神經場 近年來,它已成為計算機圖形學和計算機視覺領域的一個日益熱門的話題。通過使用將坐標作為輸入并在該位置輸出相應數據的神經網絡,神經場可以表示形狀、外觀、運動和其他物理量等 3D 數據。 這些表示已被證明在生成建模和三維重建等各種應用中非常有用。 NVIDIA 項目,如: NGLOD, GANcraft, NeRF-Tex, EG3D, Instant-NGP 和 可變比特率神經場 ,正在以各種方式推進神經領域、計算機圖形學和計算機視覺領域的最新技術。 神經領域的研究進展迅速,這意味著標準和軟件往往落后。實現差異可能導致質量指標和性能的巨大差異。新項目的啟動成本可能相當高,因為神經場的組成部分越來越復雜。研究小組之間的工作經常重復——例如,創建整個交互式應用程序來可視化神經場輸出。 一個重要的里程碑是: NVIDIA Instant NGP ,

Source

]]>
4762
深度學習研究可能引發新的恐龍發現 http://www.open-lab.net/zh-cn/blog/deep-learning-study-could-spark-new-dinosaur-discoveries/ Mon, 28 Feb 2022 06:33:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3108 Continued]]> 將新技術應用于研究古代歷史,研究人員希望通過一種新的人工智能算法擴大對恐龍的了解。這項研究發表在 地球科學前沿 上,使用高分辨率計算機斷層掃描( CT )成像結合深度學習模型來掃描和評估恐龍化石。這項研究是朝著創造一種新工具邁出的一步,這種工具將極大地改變古生物學家研究古代遺跡的方式。 “計算機斷層掃描以及其他成像技術已經揭示了化石中以前隱藏的結構,但高分辨率圖像需要古生物學家花費數周甚至數月的時間進行后期處理,通常是從巖石基質中分割化石。人工智能的引入不僅可以加快化石研究中的數據處理,而且還可以提高化石研究的效率。” ut 還為更客觀、更具重現性的研究建立了基準,”主要作者、美國自然歷史博物館理查德·吉爾德研究生院博士生余聰宇說。 為了全面了解古代脊椎動物,古生物學家關注內部解剖學,如顱骨容量、內耳或血管空間。為此,研究人員使用了一種稱為薄切片的技術。

Source

]]>
3108
自主人工智能超越大賽車世界冠軍 http://www.open-lab.net/zh-cn/blog/autonomous-ai-outraces-gran-turismo-world-champs/ Thu, 17 Feb 2022 04:15:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3087 Continued]]> 得益于索尼 AI 、索尼互動娛樂( SIE )以及 GT Sport 的開發者 Polyphony Digital Inc .的最新合作, Gran Turismo ( GT ) Sport 的競爭對手正面臨一個新的、 AI 超級強大的競爭者。 被稱為 Gran Turismo Sophy ( GT Sophy )的自主人工智能賽車代理最近擊敗了 GT 運動領域的世界最佳車手。發表在 Nature, 上的 工作 介紹了一種新的深度強化學習平臺,用于創建 GT Sophy ,并可能為全球玩家帶來新的人工智能體驗。 索尼集團公司董事長、總裁兼首席執行官吉田健一郎在一份 發布. 的聲明中說:“索尼的目的是‘通過創造力和技術的力量,讓世界充滿情感’,而大圖里斯莫·索菲就是這一點的完美體現。” “我們為游戲玩家打造了一款游戲 AI ,這是索尼作為一家創意娛樂公司的獨特之處。

Source

]]>
3087
如何閱讀研究論文: ML 從業者的實用方法 http://www.open-lab.net/zh-cn/blog/how-to-read-research-papers-a-pragmatic-approach-for-ml-practitioners/ Wed, 15 Dec 2021 06:44:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2650 Continued]]> 數據科學家或機器學習專家有必要閱讀研究論文嗎? 簡而言之,答案是肯定的。如果你沒有正式的學術背景,或者只獲得了機器學習領域的本科學位,也不要擔心。 對于沒有廣泛教育背景的個人來說,閱讀學術研究論文可能會有威脅。然而,缺乏學術閱讀經驗不應妨礙數據科學家利用 machine learning 和 AI development 的寶貴信息和知識來源。 這篇文章為任何技能水平的數據科學家提供了一個實踐教程,他們可以閱讀 NeurIPS 、 JMLR 、 ICML ,以及 等學術期刊上發表的研究論文。 在全神貫注于如何閱讀研究論文之前,學習如何閱讀研究論文的第一階段包括選擇相關主題和研究論文。 機器學習和數據科學領域擁有大量可以研究的學科領域。但這并不一定意味著在機器學習中處理每個主題是最好的選擇。 雖然建議入門級實踐者進行泛化,但我猜當涉及到長期機器學習時,職業前景、

Source

]]>
2650
人人超碰97caoporen国产