• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    人工智能/深度學習

    Clara Parabricks 3.7 為基因小組帶來了優化和加速的工作流程

    由 GPU 驅動的 NVIDIA Clara Parabricks v3 的最新版本。 7 包括對種系變體調用者的更新、對 RNA 序列管道的增強支持以及基因面板的優化工作流程。現在有超過 50 種工具, Clara Parabricks 為臨床和研究工作流程中的基因面板、外顯子組和基因組提供準確和加速的基因組分析。

    迄今為止, Clara Parabricks 已經證明,與基于 CPU 的環境相比,用于全基因組工作流程( 22 分鐘內完成端到端分析)和外顯子組工作流程( 4 分鐘內完成端到端分析)的最先進生物信息學工具的速度提高了 60 倍。大規模測序項目和其他全基因組研究能夠在單個 DGX 服務器上每天分析 60 多個基因組,同時降低了相關成本,產生了比以往任何時候都有用的見解。

    包括 泰國國家生物銀行人類基因組中心與東京大學基因組學研究院圣路易斯華盛頓大學Regeneron 遺傳學中心和英國生物銀行斯坦福大學 Euan Ashley 的實驗室 在內的許多組織正在使用 Clara Parabricks 進行快速基因組和外顯子組分析,以用于大人口項目、危重患者以及其他癌癥和遺傳病項目。他們的工作旨在準確、快速地識別致病變異,與加速的下一代測序和加速的基因組分析保持同步。

    NVIDIA Clara Parabricks v3.7 概述

    • 通過支持獨特的分子標識符( UMIs ),也稱為分子條形碼,加快和簡化基因面板工作流程。
    • 使用第二個基因融合調用者 Arriba 和 RNA-Seq 定量工具 Kallisto 對轉錄組工作流的 RNA-Seq 支持。
    • 用 ExpansionHunter 檢測短串聯重復序列( STR )。
    • 集成最新版本的生殖系調用者 DeepVariant v1 。 1 和 GATK v4 。 2 為單倍型。
    • 一個 10 倍加速的 BAM2FASTQ 工具,用于將存儲為 BAM 或 CRAM 文件的存檔數據轉換回 FASTQ 。數據集可以根據新的和改進的引用進行更新。
    Parabricks workflow diagram.Parabricks workflow diagram.
    圖 1:Clara Parabricks 3.7 包括用于基因面板的 UMI 工作流程、用于短串聯重復序列的 ExpansionHunter 、包含 DeepVariant 1.1 和 GATK 4.2 版本,以及用于 RNA Seq 工作流程的 Kallisto 和 Arriba 。

    Clara Parabricks 3.7 加速和簡化了基因面板分析

    盡管全基因組測序( WGS )由于大規模的人群計劃而不斷增長,但基因面板仍然主導著臨床基因組分析。隨著時間成為臨床護理中最重要的因素之一,加速和簡化基因小組工作流程對于臨床測序中心至關重要。通過進一步減少與基因面板相關的分析瓶頸,這些測序中心可以更快地向臨床醫生返回結果,提高患者的生活質量。

    用于基因檢測的癌癥樣本通常來自實體腫瘤或患者血液(液體活組織檢查)中的無細胞 DNA 。與 WGS 的發現工作相比,基因小組狹隘地專注于識別已知基因中的基因變體,這些基因要么會導致疾病,要么可以通過特定療法進行靶向治療。

    遺傳性疾病的基因面板通常測序覆蓋率為 100 倍,而癌癥測序的基因面板測序深度要高得多,液體活檢樣本的測序深度高達 1000 倍。檢測與癌癥相關的低頻率體細胞突變需要更高的覆蓋率。

    為了提高這些基因面板的檢測極限,使用了分子條形碼或 UMI ,因為它們顯著降低了背景噪聲。這一檢測極限適用于液體活組織檢查,可以包括數以萬計的檢測范圍,并與 UMIs 相結合,以識別血液中循環的大海撈針體細胞突變。高深度基因面板測序可以在更多測序讀取所需的處理中重新引入計算瓶頸。

    使用 Clara Parabricks , UMI 基因面板現在可以比傳統工作流程快 10 倍,在不到一小時的時間內產生結果。

    分析工作流程也得到了簡化。從 raw FASTQ 到 consensus FASTQ ,與傳統的 Fulcrum Genomics ( Fgbio )等價物相比,單個命令行運行多個輸入,如下面的示例所示。

    The simplified 3-step workflow of Parabricks compared to the 10-step Fgbio.The simplified 3-step workflow of Parabricks compared to the 10-step Fgbio.
    圖 2:Clara Parabricks 3.7 與 Fgbio 等效物相比,簡化并加速了基因面板 UMI 工作流程。

    Arriba 和 Kallisto 的 RNA Seq 支持

    正如基因面板對于癌癥測序分析很重要一樣, RNA-Seq 工作流程對于轉錄組分析也很重要。除了恒星融合, Clara Parabricks v3 。 7 現在包括 Arriba ,一種基于恒星的融合檢測算法 RNA 序列比對器。基因融合是兩個不同的基因由于染色體的巨大改變而結合在一起,與從白血病到實體瘤等多種不同類型的癌癥有關。

    Arriba 還可以檢測病毒整合位點、內部串聯重復、整外顯子重復、環狀 RNA 、涉及免疫球蛋白/ T 細胞受體位點的增強子劫持事件以及內含子或基因間區域的斷點。

    Clara Parabricks v3 。 7 還結合了 Kallisto ,這是一種基于偽比對的快速 RNA 序列量化工具,可從批量或單細胞 RNA 序列數據集中識別轉錄物豐度(基于測序讀取計數的 aka 基因表達水平)。 RNA 序列數據的比對是 RNA 序列分析工作流程的第一步。 Clara Parabricks 3.7 提供了轉錄本定量、讀取比對和融合調用的工具,現在提供了一整套支持多個 RNA 序列工作流的工具。

    用 ExpansionHunter 進行短串聯重復檢測

    為了支持從短讀測序數據中對短串聯重復序列( STR )進行基因分型,在 Parabricks v3 中添加了 ExpansionHunter 支持。 STR ,也稱為微衛星,在人類基因組中普遍存在。這些非編碼 DNA 區域具有類似手風琴的 DNA 延伸,包含長度在 2 到 7 個核苷酸之間的核心重復單元,串聯重復,最多幾十次。

    STR 在遺傳圖譜構建、基因定位、遺傳連鎖分析、個體鑒定、親子鑒定、群體遺傳學和疾病診斷等應用中非常有用。

    人類基因組中有許多區域由這些重復序列組成,它們的重復次數會增加,從而導致疾病。脆性 X 綜合征、肌萎縮側索硬化癥和亨廷頓氏病是常見的重復相關疾病。

    ExpansionHunter 旨在通過對 BAM / CRAM 文件執行有針對性的搜索來估計重復序列的大小,以便對每個 STR 中完全包含的跨、側翼和側翼讀取進行排序。

    添加體細胞呼叫者并支持歸檔數據

    2021 以前的版本 Clara Parabricks 帶來了一系列新的工具,最重要的是增加了五個軀體學呼叫者 MuSE 、 LoFReq 、 StRekA2 、 MutuSc2 和體細胞狙擊手,用于全面的癌癥基因組分析。

    Shows the workflow of Parabricks for somatic workflows and performance benchmarks exceeding native runtimes. Shows the workflow of Parabricks for somatic workflows and performance benchmarks exceeding native runtimes.
    圖 3:Clara Parabricks v3 。 6.1 和 3.7 包括用于全面加速癌癥基因組分析的五位軀體來電者 Muse 、 LoFreq 、 Strelka2 、 Mutect2 和 SomaticSniper 。

    此外,還添加了一些工具,以便在刪除原始 FASTQ 文件以節省存儲空間的情況下利用歸檔數據。 BAM2FASTQ 是 GATK Sam2fastq 的加速版本,它將現有 BAM 或 CRAM 文件轉換為 FASTQ 文件。這允許用戶將測序讀數重新調整到一個新的參考基因組,這將允許調用更多的變體,同時為研究人員提供將所有數據標準化為同一參考的能力。使用現有的 fq2bam 工具, Clara Parabricks 可以在不到 2 小時的時間內將讀取從一個參照物重新排列到另一個參照物,從而獲得 30 倍的全基因組。

    Shows the workflow of Parabricks for gremlin workflows and performance benchmarks showing runtime of 22 minutes.Shows the workflow of Parabricks for gremlin workflows and performance benchmarks showing runtime of 22 minutes.
    圖 4:Clara Parabricks v3 。 7 添加了帶有單倍型調用程序的種系變體調用程序 DeepVariant 1.1 和 GATK 4.2 的最新版本。
    ?
    ?

    ?

    0

    標簽

    人人超碰97caoporen国产