• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    AI 平臺/部署

    借助 Databricks Pixels 2.0 和 MONAI 加速醫學影像 AI 運營

    根據世界衛生組織(WHO)的數據,全球每年都會進行 36 億次醫學影像檢查,以診斷、監測和治療各種疾病。大多數圖像都存儲在全球公認的標準 DICOM(Digital Imaging and Communications in Medicine)中。DICOM 格式的成像研究結合了非結構化圖像和結構化元數據。

    數據倉庫等典型的數據管理系統無法適應非結構化數據類型。此外,數據湖無法對元數據進行分類和存儲,而元數據對于搜索、治理和這些影像檢查的可訪問性至關重要。Databricks Pixels 0.6 于 2021 年開發,通過提供可擴展的環境解決了許多此類挑戰,您可以從中提取、管理和編錄 Databricks Data Intelligence Platform 中的所有醫學影像數據。

    現在,借助 Databricks Pixels 2.0 解決方案加速器,其他增強功能包括與 NVIDIA 加速計算平臺 MONAI 的集成。MONAI 是一套開源框架,用于加速醫學影像領域的研究和臨床協作。這一集成帶來了顯著的改進,包括用于提取、管理和分析醫療健康圖像的端到端功能,這些功能可以有意義地協助臨床分析。

    本文將介紹這些集成的優勢,以及如何使用 Pixels 2.0 快速開發概念驗證應用程序,該應用程序可顯示 CT 研究,使用 AI 對其進行預先注釋,使用戶能夠進行校正,然后通過實時更新對模型進行微調 (active learning)。

    AI 驅動的醫學影像處理

    醫療健康領域最重要的進步之一是將 AI 集成到醫學影像中。AI 驅動的系統正在通過簡化工作流程、減少放射科醫生的工作量和改善患者治療效果來改變放射學。這些技術可以檢測影像研究中的異常情況,優先處理緊急病例,并加快診斷和治療計劃。這對于解決醫學影像服務日益增長的需求和放射學專業人員的短缺問題尤為重要。

    然而,要實現這些承諾,需要能夠整合和管理各種數據源,包括影像文件、電子健康記錄(EHR)、放射學報告和臨床數據。此外,將 AI 集成到醫學影像中還帶來了額外的挑戰,例如管理復雜的 MLOps 工作流以進行模型訓練和操作,同時確保遵守 HIPAA 和 GDPR 等嚴格的法規。有效的治理、可見性和數據訪問對于克服這些挑戰至關重要。

    使用 DICOM 進行生命科學分析時面臨的挑戰

    DICOM 是一項全球醫療健康標準,描述了醫學影像在不同系統 (例如 X-ray 設備、存儲系統和醫療級查看器) 之間的結構和傳輸。

    從廣義上講,DICOM 文件包含一個包含豐富元數據信息的標頭以及一組一個或多個圖像強度值 (像素) 幀。雖然這些標簽以復雜的結構排列,但它們包含有價值的信息,并且完整地編入索引。其他解決方案通常會提取一小部分標簽。

    Graphic titled ‘DICOM: Quick look at the file structure’ explaining the main components of a DICOM file, including 1) Header containing patient info, data acquisition parameters for the imaging study, image dimensions, matrix size, color space, organized into groups.
    圖 1. DICOM 文件結構。源:DICOM 文件處理軟件的比較研究:基于 Anatomage 表的研究

    在探索涉及 DICOM 和其他醫學影像的醫療健康和生命科學分析工作流時,我們發現了一個共同的挑戰。許多組織都面臨著一系列互不關聯的技術解決方案,通常在訪問控制、審計日志和數據沿襲方面缺乏連貫一致的治理。

    在單個組織中,多個研究小組獨立開發了自己的方法來提取和準備用于分析和建模的 DICOM 文件,這種情況并不少見。這種碎片化通常會導致:

    • 5-10 個不同的研究人員組
    • 5 到 10 種不同的解決方案,用于處理 DICOM 文件
    • 整個組織中使用了多種技術
    • 專用于獨立數據管理任務的重要 IT 資源

    為了充分發揮 AI 在醫學成像領域的潛力,簡化成像數據管理的工具 (如 DICOM) 至關重要。

    對研究團隊的影響

    這種技術分散給包括生物信息學家、數據工程師和數據科學家在內的各個團隊成員帶來了重大挑戰。這些專業人員經常會發現自己在努力解決擴展端到端處理工作流的復雜性。缺乏統一、精簡的方法可能會影響效率,并可能會減緩寶貴的研究進展。通過應對這些挑戰,并致力于開發更集成、更可控的解決方案,組織將有機會顯著提高其在醫學影像分析領域的研究能力和成果。

    Databricks Pixels 2.0 Solution Accelerator 與 NVIDIA 加速計算平臺和 MONAI 的集成旨在為醫療健康行業的研究人員、分析專業人員和數據科學家等個人賦能。其優勢包括:

    • 加速研究 :研究人員可以比以往更快地開發和訓練用于醫學影像的 AI 模型。
    • 提高診斷準確性 :AI 輔助影像分析可以幫助放射科醫生更準確地識別異常情況。
    • 簡化工作流程 :解決方案加速器可自動執行耗時的任務,使醫療健康提供商能夠更專注于患者護理。
    • 增強協作 :該平臺有助于醫療健康機構更輕松地共享見解和模型,從而促進該領域的創新。

    能夠統一和治理 Databricks Data Intelligence Platform 上醫療健康數據集的所有模式 (包括 HL7、FHIR、DICOM 等) 有助于優化分析驅動的工作流。

    Databricks 在您的云存儲帳戶中提取、處理和存儲衍生元數據、特征和數據段。此解決方案加速器使用機器學習 (ML) 模型 (例如 MONAI Label Auto Segmentation 模型) 執行索引、去識別化和特征化。它還利用標記和豐富的可視化執行交互式 ML 主動學習工作流。所有這些活動都在符合 HIPAA 的可擴展云環境中受到保護,需要可靠地處理數百到數十億的 DICOM 圖像。

    Databricks Pixels 解決方案加速器的發展

    第一版 Databricks Pixels 0.6 解決方案加速器的核心意圖是加快 DICOM 元數據的提取、索引和可訪問性的價值實現時間,這些元數據是醫療健康和生命科學 Lakehouse 的一部分。根據 Pixels Solution Accelerator 的最初作者 Douglas Moore 的說法,“為客戶運行基于 DICOM 元數據的 SQL 是一個引人入勝的愿景。”

    Pixels 0.6 使用現成且經過良好測試的 Pydicom GDCM 庫打開 DICOM 文件,以從圖像中提取標頭元數據標簽、所有標簽和一些指標。這些操作通過 Spark 用戶定義函數 (UDFs) 進行擴展和擴展,而云層則通過基于 FUSE 的 DBFS 掛載或 S3FS API 調用進行抽象化。

    Databricks 為客戶去孤島化數據。Lakehouse 架構支持輕松集成從 EHR、claims 和 genomic 數據集衍生出的 DICOM。例如,UC Davis Health 從 Pixels 的使用中受益匪淺。

    加州大學戴維斯分校 (UC Davis Health) 的企業數據架構師 Peter Paing Soe 表示:“我們使用 Pixels Solution Accelerator 將 DICOM 圖像提取到我們的 Databricks 環境中。我們的統一 Lakehouse 平臺可讓教職員工綜合訪問全面的臨床數據和 DICOM 圖像,并搭配使用有效的 Databricks 計算資源。”

    Databricks 與 NVIDIA 的合作

    Databricks Data Intelligence Platform 為數據和 AI 處理提供可擴展的解決方案,以在醫學影像中利用 AI 的強大功能。Databricks 提供廣泛的治理、數據處理和廣泛的 AI 服務基礎。

    NVIDIA 提供加速計算 (GPUs) 以及專為醫學影像工作流程定制的高質量預訓練模型 (例如 MONAI)。NVIDIA 是 MONAI 和 Open Health Imaging Foundation (OHIF) 社區的主要贊助商。

    Pixels 2.0 Medical Imaging Solution Accelerator 將 Databricks 和 NVIDIA 組件整合到一個軟件包中,提供參考實現和經過良好監管的參考架構。Pixels 2.0 的安裝只需幾分鐘,運行時間也僅為一小時。

    Databricks 與 NVIDIA 的合作最終縮短了優化醫學影像工作流程的價值實現時間。

    Databricks Pixels 2.0 Solution Accelerator 的主要特性

    Pixels 2.0 提供以下主要功能:

    • 流式傳輸、增量批處理以及完整的歷史加載和處理 :提取、解壓縮、索引和執行去識別化、基于 AI 的分割,以及在完整歷史負載、增量批量(例如,每天或每小時)或作為連續流的基礎上進行其他特征化。
    • 統一治理,通過 Unity Catalog 共享數據 :治理原始數據、來自標簽的復雜結構化數據、衍生聚合和計算集群,以及 AI 模型。
    • 受保護的健康信息 (PHI) 編輯 :通過開源或商用軟件包對 PHI 標簽和圖像數據進行去識別化處理。
    • 擴展到零模型服務、推理、分割和主動學習: 在生產環境中經濟高效地應用 AI 和 ML,處理 DICOM 存檔、日常批量處理、每小時迷你批量處理、流式傳輸或由用戶驅動的交互式應用程序需求。
    • 具有標記功能的交互式 OHIF 查看器集成為集成的 Lakehouse 應用: 在以人為中心的工作流中,能夠對 Lakehouse 中存儲的圖像進行可視化、標記和命令 ML 操作。
    • 開放 API 和 Delta Sharing、Clean Rooms :助力實現部門和設備間的互操作性。促進不同組織之間的開放式 (安全) 協作。

    圖 2 中的參考解決方案架構圖總結了 Databricks Pixels 2.0 解決方案加速器提供的功能。

    A diagram of Pixels 2.0 Reference Solution Architecture outlining data acquisition, processing, protection, and AI-powered inferencing for medical imaging.
    圖 2、Pixels 2.0 參考解決方案架構整合了 NVIDIA 和 Databricks 的功能

    通過將所有這些功能整合到一個 Solution Accelerator 中,組織可以實現所需的工作流優化,減少復雜的架構,并實現所需的規模。

    高效處理和分析醫學影像數據

    結合使用,Databricks 和 MONAI 能夠解決醫療健康領域最緊迫的挑戰之一:高效處理和分析每天生成的大量醫學影像數據。

    MONAI Label 是一款智能工具,用于創建、訓練和部署用于醫學影像標注和分割的 ML 模型。借助主動學習,它可將數據標記所需的時間和精力減少多達 75%。該工具有助于在 CT 掃描中自動分割像素和體素。對使用 1,000 多個 DICOM 圖像幀進行的成像研究進行推理,可獲得詳細的顏色編碼疊加層,以及人體軀干 CT 掃描中器官的精確矢量表示。

    這項工作在批處理、流式傳輸和實時推理模式下引入了 CT 圖像的生產級自動分割。該模型 (開箱即用或微調) 已注冊到 Databricks Unity Catalog。運行時的作業會加載模型和權重,然后對 DICOM 文件執行推理。

    對于交互式用例,MONAI Label 部署到基于 GPU 的零擴展端點。模型端點得到全面管理,模型的新“冠軍”版本將自動部署到生產環境中。安全模型服務端點可輕松構建交互式數據應用。例如, OHIF viewer 是一款醫療級開源成像查看器,易于集成和管理。

    視頻 1、由 OHIF 提供支持的安全湖屋應用程序集成 DICOM Viewer

    主動學習工作流程包括標記 CT 掃描的部分,將標注 (標簽) 保存回 Databricks,然后在 Databricks 管理的機器學習 GPU 集群上重新訓練模型。主動學習工作流程完全由與 OHIF 查看器的交互驅動。OHIF 查看器作為 Lakehouse 應用集成到 Databricks Data Intelligence Platform 安全“umbrella”中。

    視頻 2、MONAI Label 與 OHIF Viewer 的集成,展示了在 Databricks 環境中醫學影像的 AI 輔助分割

    開始使用

    醫療健康行業的未來由數據驅動。 Databricks Pixels 2.0 解決方案與 NVIDIA 加速計算平臺MONAI 的集成帶來了顯著的改進,包括端到端的醫療健康圖像提取、管理和分析功能,這些功能可以有意義地協助臨床分析。

    您可以使用 Pixels 2.0 快速開發概念驗證應用程序,該應用程序可顯示 CT 研究,使用 AI 對其進行預先注釋,使用戶能夠進行校正,然后通過實時更新 (active learning) 微調模型。

    準備好開始探索 Databricks-NVIDIA Solution Accelerator 了嗎?按照以下步驟操作:

    1. 登錄您的 Databricks 工作空間或使用 快速設置體驗 創建新的試用版。選擇“Professional”。
    2. Fork GitHub repo 然后克隆到 Databricks 工作空間中的 repo 文件夾中
    3. 在 Databricks 集群上運行 RUNME notebook,以創建一個示例的數據攝入和分割管道。
    4. 查看 README 中調用的其他 notebook,以部署您的 Lakehouse 應用或主動學習設置。

    如需其他支持,請聯系您的 Databricks 或 NVIDIA 賬戶團隊。您還可以訪問 GitHub 上的 databricks-industry-solutions/pixels ,以發布問題和 issues。如需了解有關 MONAI 的更多信息,請查看 MONAI Quickstart GuideMONAI Model Zoo

    0

    標簽

    人人超碰97caoporen国产