neural networks – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Mon, 05 Dec 2022 10:01:24 +0000 zh-CN hourly 1 196178272 使用 NVIDIA Jetson Nano 開發套件提高您的邊緣 AI 和機器人技能 http://www.open-lab.net/zh-cn/blog/sharpen-your-edge-ai-and-robotics-skills-with-the-nvidia-jetson-nano-developer-kit/ Tue, 22 Nov 2022 09:50:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5755 Continued]]> 你有興趣開始學習邊緣人工智能和機器人技術,但不知道從哪里開始? 看看合作伙伴重新推出的 NVIDIA Jetson Nano 開發者套件,該套件將于 2022 年 11 月 25 日開始在美國和 12 月在全球發售。 3 年前推出的 NVIDIA Jetson Nano 是一款面向嵌入式和邊緣人工智能市場的低成本入門級人工智能計算機。憑借熟悉的 Linux 環境、易于遵循的教程,以及由活躍的開發人員社區創建的開源項目,它是邊干邊學的完美工具。 這臺小巧而強大的計算機可以讓您并行運行多個神經網絡,用于圖像分類、對象檢測、分割和語音處理等應用。所有這些都被打包到一個易于使用的平臺中,該平臺的功耗僅為 5 瓦。 去年,明尼蘇達大學的研究人員開發了一種 neuroprosthetic hand ,它使用基于遞歸神經網絡( RNN )的 AI…

Source

]]>
5755
結合卷積和注意機制改進日語 ASR http://www.open-lab.net/zh-cn/blog/improving-japanese-language-asr-by-combining-convolutions-with-attention-mechanisms/ Mon, 12 Sep 2022 05:31:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5278 Continued]]> 自動語音識別( ASR )研究通常側重于高資源語言,如英語,它由數十萬小時的語音支持。最近的文獻重新關注更復雜的語言,如日語。與其他亞洲語言一樣,日語有大量的基本字符集(普通白話中使用了 3000 多個獨特的字符),并提出了獨特的挑戰,例如多個詞序。 這篇文章討論了最近提高日語 ASR 準確性和速度的工作。首先,我們改進了 Conformer ,這是一種最先進的 ASR 神經網絡架構,在訓練和推理速度方面取得了顯著的改進,并且沒有精度損失。其次,我們增強了一個具有多頭部自我注意機制的純深度卷積網絡,以豐富輸入語音波形的全局上下文表示的學習。 Conformer 是一種神經網絡體系結構,廣泛應用于多種語言的 ASR 系統中,并取得了較高的精度。然而, Conformer 在訓練和推斷方面都相對較慢,因為它使用了多頭自我注意,對于輸入音頻波的長度,其時間/

Source

]]>
5278
教機器用計算機視覺閱讀樂高手冊 http://www.open-lab.net/zh-cn/blog/teaching-machines-to-read-lego-manuals-with-computer-vision/ Thu, 18 Aug 2022 03:16:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4936 Continued]]> 樂高愛好者抓撓他們的頭,閱讀組裝說明,可能很快有助于復雜的建設,感謝一個新的 學習 來自斯坦福大學、麻省理工學院和 Autodesk 。研究人員設計了一個深度學習框架,將 2D 手冊翻譯成機器可以理解的步驟,以構建 3D 樂高套件。這項工作可以推動專注于制造機器的研究,幫助人們組裝物體。 “樂高手冊提供了一個獨立的環境,展示了人類的一項核心技能:在指導下學習完成任務。利用視覺場景解析和程序合成的最新進展,我們旨在構建具有類似技能的機器,從樂高開始,最終以現實世界場景為目標,”該研究資深作者吳家軍說,斯坦福大學計算機科學助理教授。 研究人員表示,用人工智能翻譯 2D 手冊面臨兩大挑戰。首先, AI 必須基于 2D 手動圖像在每個裝配步驟中學習和理解 3D 形狀之間的對應關系。這包括考慮工件的方向和對齊。 它還必須能夠對磚塊進行分類,并在半組裝模型中推斷出磚塊的三維姿態。

Source

]]>
4936
使用 NVIDIA TAO 工具包構建和部署對話 AI 模型 http://www.open-lab.net/zh-cn/blog/building-and-deploying-conversational-ai-models-using-tao-toolkit/ Tue, 09 Nov 2021 09:48:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2257 Continued]]> 對話式人工智能是一組技術,能夠在人類和設備之間基于最自然的界面(語音和自然語言)進行類似人類的交互。基于對話人工智能的系統可以通過識別語音和文本、在不同語言之間進行即時翻譯、理解我們的意圖以及以模仿人類對話的方式響應來理解命令。 構建對話式人工智能系統和應用程序很困難。為您的數據中心部署量身定制哪怕是單個組件來滿足您企業的需求就更難了。特定于領域的應用程序的部署通常需要幾個周期的重新培訓、微調和部署模型,直到滿足需求為止。 為了解決這些問題,本文介紹了三個關鍵產品: 由于這些產品的緊密集成,您可以將 80 小時的培訓、微調和部署周期壓縮到 8 小時。在本文中,我們將重點介紹 TAO 工具包,向您展示它如何支持各種遷移學習場景,以及它如何與 Riva 集成以部署對話 AI 模型和運行實時推理。 在對話人工智能系統中,有幾個組件,大致分為三個主要領域(圖 1 ):

Source

]]>
2257
人人超碰97caoporen国产