• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    概括

    使用 NVIDIA Clara Parabricks 3.8 進行大規模癌癥基因組測序分析和變異注釋

    生物信息學家一直在尋找新的工具來簡化和增強基因組分析管道。 NVIDIA Clara Parabricks 擁有 60 多種工具,能夠在研究和臨床環境中為種系和體細胞工作流程提供準確、快速的基因組分析。

    今天,我們宣布發布 NVIDIA Clara Parabricks 3.8 ,特點:

    • 快速變體注釋工具。
    • 腫瘤只需要臨床癌癥工作流程。
    • 安培的額外支持 GPU 。

    序列數據的快速增長要求更快的變體調用格式( VCF )讀寫速度。 Clara Parabricks 3.8 擴展了快速變量注釋、變量后調用、使用 snpswift 支持自定義數據庫注釋以及使用 bcftools 調用變量結果。在 Clara Parabricks 上, snpswift 提供了快速準確的 VCF 數據庫注釋,并利用了廣泛的數據庫。

    測序技術的進步擴大了基因組學在臨床腫瘤學中的作用。 NVIDIA Clara Parabricks 現在為臨床癌癥工作流程提供了僅限腫瘤的體細胞呼叫者 LoFreq 和 Mutect2 呼叫。腫瘤正常呼叫可通過 LoFreq 、 Mutect2 、 Strelka2 、 SomaticSniper 、 Muse 在 Parabricks 上進行。

    基因組科學家可以通過使用更廣泛的 GPU 體系結構運行 Clara Parabricks ,進一步加快基因組分析工作流程,包括 A6000 、 A100 、 A10 、 A30 、 A40 、 V100 和 T4 。這也支持客戶使用由特定 NVIDIA GPU 驅動的下一代測序儀器進行基址調用,這些客戶希望使用相同的 GPU 對 Clara Pararicks 進行二次分析。

    擴展的快速變體注釋

    在 1 月份發布的 Clara Parabricks 3.7 ,添加了一個新的變體注釋工具,有助于為下游基因組分析提供變體的功能信息。這一點很重要,因為正確的變體注釋有助于基因組研究和臨床診斷的最終結論。

    Pararicks 的變體注釋工具 snpswift 提供了快速而準確的 VCF 數據庫注釋,與其他社區變體注釋解決方案(如 vcfanno )相比,它可以在更短的運行時內提供結果。 Snpswift 帶來了更多的功能和加速,同時保留了 VCF 文件的精確等位基因數據庫注釋的基本功能。新的 snpswift 工具還支持用 ENSEMBL 中的基因名稱數據注釋 VCF 文件,有助于理解編碼變體。

    支持的數據庫包括 dbSNP 、 gnomAD 、 COSMIC 、 ClinVar 和 1000 個基因組。 Snpswift 可以對這些變量進行聯合注釋,為篩選 VCF 變量和解釋其重要性提供重要信息。此外, snpswift 能夠使用來自 ENSEMBL GTF 的信息注釋 VCF ,以添加詳細信息并利用該領域中其他廣泛使用的數據庫。

    Runtime comparison for Clara Parabricks’ variant annotation tool snpswift vs. vcfanno.
    圖 1 :。 Clara Pararicks 的變體注釋工具 snpswift 比其他社區變體注釋工具(如 vcfanno )提供更快、更準確的 VCF 數據庫注釋

    除了這些廣泛使用的數據庫外,許多研究機構和公司都有自己豐富的內部數據集,這些數據集可以為每個變體提供有價值的特定領域信息。

    Clara Parabricks 3.8 中的 Snpswift 現在使用多個自定義 TSV 數據庫對 VCF 進行注釋。 Snpswift 還能夠在 30 秒內用包含 500K 變體的自定義 TSV 注釋 600 萬變體 HG002 VCF 。用戶可以使用 VCF 、 GTF 和 TSV 數據庫聯合注釋 VCF ,所有這些都只需一個命令,只需一次運行。

    最后, Clara Parabricks 3.8 包含了后果預測。預測變異的功能結果是對遺傳變異進行分類和排序注釋的關鍵步驟。 Parabricks 3.8 提供了一個 bcftoolscsq 命令,該命令封裝了眾所周知且速度極快的 bcftools csq 工具 ,提供了單體型感知的結果預測。這導致 VCF 文件中的變體分階段,以避免變體影響相同密碼子時出現常見錯誤。

    Performance comparison of BCFtools/csq with three popular consequence callers
    圖 2 :。這張圖片拍攝于 調用 GitHub 鏈接的結果。 BCFtools / csq 與三個常用結果調用程序的性能比較,使用一個帶有 450 萬個站點的 VCF 示例

    與基于CPU的環境相比,最先進的生物信息學工具的速度提高了60倍。全基因組工作流程的端到端分析只需22分鐘,外顯子組工作流程只需4分鐘。大規模測序項目和其他全基因組研究能夠在一臺DGX服務器上每天分析60多個基因組,同時降低相關成本,產生比以往任何時候都有用的見解。

    要開始使用 NVIDIA AWS Marketplace Parabricks ,了解您的生殖系、癌癥和 RNA 序列分析工作流, 免費試用 90 天 。您可以使用 Clara 在本地或云中訪問 Clara Parabricks 。

    關于如何使用 Parabricks 3.8 注釋變量以及如何使用示例數據運行結果預測的概述,請參見 GitHub Gist


    0

    標簽

    人人超碰97caoporen国产