NVIDIA Parabricks 是一款可擴展的基因組學分析軟件套件,通過加速計算和深度學習解決 omics 挑戰,實現新的科學突破。
NVIDIA Parabricks v4.5 在 NVIDIA GTC 2025 上發布,通過支持最新的 NVIDIA GPU 架構,并通過結合使用 Giraffe 和 DeepVariant 來改進對齊和變體識別,從而支持不斷增長的數據量。該版本還包括改進的功能,并縮短了跨多個行業領先工具 (包括 STAR、FQ2BAM 和 Minimap2) 的分析時間。
Parabricks v4.5 隨附用于基因組學和單細胞分析的全新 NVIDIA AI Blueprints,使生物信息學家和基因組學平臺提供商能夠輕松部署和測試 NVIDIA Parabricks 和 NVIDIA RAPIDS,而無需本地 GPU 或自管理云配置。通過擴展可訪問性,科學家和研究人員可以更快地啟動和運行,以進一步了解基因組。
版本亮點包括:
新增內容
- 通過 NVIDIA Brev 提供 NVIDIA Blueprints,包括使用 Parabricks 進行基因組學分析,以及利用 RAPIDS 和 RAPIDS-singlecell 進行單細胞分析。
- Parabricks 支持 NVIDIA Blackwell,包括新的 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,使用四個 GPU 將整體生殖系分析時間縮短為 7 分鐘 56 秒。
- 能夠輕松地結合使用 Giraffe 和 DeepVariant,并將 pangenome 分析的強大功能與變異識別的黃金標準相結合。
- 與 Roche Sequencing 合作。
改進的功能
- STAR 加速 (現有速度的 2 倍加速)
- 更快的 FQ2BAM(恢復模式改進)
- 在 Haplotypecaller/Mutectcaller 中實現更快的強制呼叫模式
- 速度更快的 Giraffe (比基準 VG Giraffe 的速度快 3.7 倍以上)
- Minimap2 加速 (包括 splice-alignment)
借助 NVIDIA Blueprints 輕松部署和運行基因組學和單細胞分析
AI Blueprints 為代理式 AI 和生成式 AI 提供了參考工作流,因此企業可以構建、測試和部署自定義 AI 應用 。在部署大規模企業藍圖之前, 生物信息學家現在可以通過 NVIDIA Brev 訪問輕量級藍圖,從而輕松評估由 NVIDIA 技術支持的加速基因組學庫,而無需設置基礎設施或進行艱巨的部署。
在 NVIDIA GTC 2025 上,NVIDIA 發布了兩個基因組學用例藍圖:基因組學分析和單細胞分析。這兩者都使生物信息學家和基因組學平臺提供商能夠輕松部署和使用 NVIDIA 技術,包括 NVIDIA Parabricks 和 RAPIDS。
對于基因組學分析 ,生物信息學家可以使用 NVIDIA Parabricks FQ2BAM 進行對齊,使用 DeepVariant 進行變體識別,在通過 NVIDIA Brev 提供的任何云上,只需幾分鐘即可在短時讀取的基礎上嘗試全外顯子組測序分析工作流程。
對于單細胞分析,科學家還可以通過嘗試由 scverse 開發的 rapids-singlecell 來測試近乎實時的數據分析。 這將在 100 萬個單元數據集上實現 676 倍的 UMAP 速度和 70 倍的 PCA 速度。
慕尼黑工業大學計算、信息與技術學院和 TUM 生命科學學院的雙博士學位教授 Fabian J. Theis 博士表示:“能夠在云平臺上無縫訪問 RAPIDS 單細胞 notebooks 為研究人員提供了一款功能強大且用戶友好的工具。通過讓先進的計算資源更容易獲取,我們正在促進 scverse 工具的更廣泛采用,并使社區能夠加速單細胞分析的分析和創新。”
在 NVIDIA Blackwell 上使用 Parabricks 提高性能
NVIDIA Blackwell 是最新的 GPU 架構,可大規模提升性能和效率,推動生成式 AI 和加速計算的發展。
在最新的 v4.5 版本中,Parabricks 現可與 Blackwell 配合使用,從而實現進一步加速并減少運行時間,同時利用增加的 ALU 單元和 Tensor Core 來實現更好的性能。在單個 RTX PRO 6000 上,fastq2bam 和 DeepVariant 工作流的速度比 NVIDIA H100 PCIe 快 1.75 倍。

SOPHiA GENETICS 首席技術官 Abhimanyu (Abhi) Verma 表示:“NVIDIA Parabricks 已在我們的當前基于云的 GPU 架構上實現了顯著的加速。“憑借 Blackwell 上的最新支持,我們很高興能在 SOPHiA DDM 平臺中實現更高的加速和增強的性能。這一進步使我們能夠繼續為 AI 驅動的分析提供快速的周轉時間,為世界各地的實驗室、研究人員和生物制藥提供支持。這一時機非常理想,因為我們看到,在更深層次的測序和更先進的多模態方法的全面推動下,數據量呈指數級增長。”
通過結合使用 Giraffe 和 DeepVariant,縮短運行時間并提高準確性
對齊和變異識別是分析基因組數據的關鍵步驟,這些數據協同工作,有助于了解基因變異。第一步是在對齊中安排和比較序列。接下來,科學家在變體識別過程中識別全基因組、外顯子組和基因面板的變體。
雖然對齊和變異檢測是高通量測序的關鍵組成部分,但它們是耗時的過程,需要大量計算資源,尤其是在全基因組測序方面。
為了幫助解決這些瓶頸問題,我們在對齊和變體識別步驟中開發了專門的算法和工具,包括用于對齊的 Giraffe 和用于變體識別的 DeepVariant。 Giraffe 是由加州大學圣克魯茲分校開發的軟件工具,用于 pangenome 圖對齊 。 DeepVariant 是由 Google 開發的基于深度學習的變異識別器 。這兩種熱門的開源工具不僅在幫助加快各自流程的同時,還能確保更高的準確性。
Parabricks 已支持 Giraffe 和 DeepVariant,但最新的 v4.5 通過單獨和共同提高跨工具的性能來提供進一步的加速。
因此,科學家和研究人員可以在保持準確性的同時更快地執行關鍵步驟。例如,與 CPU 相比,NVIDIA L40S 的運行時速度快 6 倍以上。在 CPU 上,Giraffe、后處理和 DeepVariant 的總運行時間為 11.98 小時。在 NVIDIA L40S 上,Parabricks v4.5 的總運行時間僅縮短到 1.8 小時。

與 Roche Sequencing 的新合作
基因組數據生成正處于轉折點, 羅氏(Roche)最近推出 的擴展測序(Sequencing by Expansion,SBX)等新技術能夠以超高的速度進行測序,這需要更快、更高的吞吐量分析。
除了其專有的加速算法外,羅氏還將 NVIDIA 硬件和軟件組件直接集成到 SBX 平臺中,包括精選的 Parabricks 組件和其他加速庫。羅氏在加速算法方面的工作與 NVIDIA 合作,將提供一個先進的數據分析架構,在充分發揮 SBX 實現的超快數據生成速率和快速測序運行時間的潛力方面發揮關鍵作用。
“SBX 技術通過高測序數據生成率和靈活的運行時間提供了顯著優勢,并通過實時集成分析得到增強,”羅氏計算科學副總裁 John Mannion 說。與 NVIDIA 的戰略合作是羅氏加速流程開發的重要組成部分,可利用 SBX 優化算法對計算密集型數據處理階段進行高效的局部分析,并增強用戶的分析工作流程。
最新的 Parabricks 基準測試
除了為每個版本提供新功能和升級外,NVIDIA 還在不斷努力提升各種儀器、工具和 GPU 的基準測試性能。表 1 概述了熱門 NVIDIA GPU 上的最新基準測試,包括 NVIDIA RTX PRO 6000 中的最新 Blackwell 支持。
請注意,這些基準測試來自 NVIDIA。速度可能會因數據集、GPU 實例和內存可用性而異。運行時適用于單個算法。當同時運行多個算法時,管道可能會部分重疊,總體運行時間可能會減少。
? | NVIDIA RTX PRO 6000 Newest Support |
NVIDIA H100 SXM GPU | NVIDIA L4 GPU Lowest cost per sample |
|||
? | 2 GPUs | 4 GPUs | 2 GPUs | 4 GPUs | 2 GPUs | 4 GPUs |
Giraffe(Paired-End) | 59.37 | 31.05 | 60.10 | 37.68 | 81.43 | 44.57 |
DeepSomatic | 43.28 | 23.93 | 54.32 | 35.13 | 215.33 | 110.05 |
Fq2bam(BWA-MEM) | 9.02 | 6.52 | 10.10 | 7.28 | 35.10 | 19.28 |
rna_fq2bam(STAR) | 7.55 | 7.03 | 7.78 | 10.23 | 22.28 | 12.73 |
fq2bam_meth(BWA-Meth) | 32.27 | 22.13 | 34.6 | 20.35 | 132.43 | 67.03 |
DeepVariant | 4.67 | 2.75 | 7.60 | 5.90 | 13.83 | 8.03 |
HaplotypeCaller | 8.33 | 3.83 | 8.63 | 4.17 | 14.2 | 7.03 |
Mutect2 | 29.50 | 13.52 | 27.67 | 13.67 | 50.91 | 26.63 |
使用 Illumina 數據對長頸鹿進行了 30 倍的全基因組測序,使用 fq2bam (BWA-MEM)、DeepVariant 和 Haplotype Caller。使用 Illumina 數據對 DeepSomatic 和 Mutect2 進行了 50 倍腫瘤正常情況下的全基因組測序。為了對 fq2bam_meth (BWA-Meth) 進行基準測試,我們從 ENCODE 門戶下載了全基因組雙亞硫酸鹽測序數據 (Sloan et al. 2016) (https://www.encodeproject.org/),其中包含以下標識符:ENCSR890UQO (庫 ENCLB898WPW)。對于 rna_fq2bam (STAR),我們使用了 FASTQ,讀取數為 381,871,632,讀取長度為 98nt (SRA:SRR19653800)。
開始使用
NVIDIA Parabricks v4.5 可改進各種行業領先工具的功能并縮短分析時間,同時支持最新的 NVIDIA Blackwell 架構。Parabricks v4.5 還附帶用于基因組學和單細胞分析的 AI Blueprint,可讓用戶輕松部署和測試 NVIDIA Parabricks 和 NVIDIA RAPIDS。
下載 NVIDIA Parabricks,開始使用 GPU 加速的基因組學分析,并加入 NVIDIA Parabricks 開發者論壇上的對話。
致謝
對 Parabricks 和 RAPIDS 團隊的貢獻和感謝。特別是對于本次發布,我們想要感謝跨職能團隊確保推出這些新產品。
對于 NVIDIA RTX PRO 6000 Blackwell Server Edition 基準測試和 Parabricks:Tong Zhu、Alejandro Chacon、Fabian Berressem、Daniel Puleri 和 Yang Wang。
借助 Brev.dev 開發 AI 藍圖:Severin Dicks、Taurean Dyer、Gary Burnett、Alice Hsiung 和 Andrew Walters。
?