BioNeMo – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 21 Feb 2025 04:57:50 +0000 zh-CN hourly 1 196178272 利用 Evo 2 以全新規模跨進化研究生命生物分子的語言 http://www.open-lab.net/zh-cn/blog/understanding-the-language-of-lifes-biomolecules-across-evolution-at-a-new-scale-with-evo-2/ Wed, 19 Feb 2025 04:52:15 +0000 http://www.open-lab.net/zh-cn/blog/?p=12974 Continued]]> AI 已從實驗好奇心發展為生物學研究的驅動力。 深度學習算法、海量組學數據集和自動化實驗室工作流程的融合使 科學家能夠解決一度被認為棘手的問題 (從快速蛋白質結構預測到生成式藥物設計),從而增加了科學家對 AI 素養的需求。在這一勢頭下,我們正處于下一次范式轉變的邊緣:專為生物學打造的強大 AI 基礎模型的出現。 這些新模型有望將不同的數據源 (基因組序列、RNA 和蛋白質組譜,在某些情況下還包括科學文獻) 統一為分子、細胞和系統級別上對生命的統一、一致的理解。學習生物學的語言和結構為變革性應用打開了大門,例如更智能的藥物發現、合理的酶設計和疾病機制闡明。 在我們為下一波 AI 驅動的突破做好準備之際,這些基礎模型顯然不僅能夠加速進展,還將重新定義生物學研究的可能性。 2024 年 11 月推出的 首個 Evo 模型 是基因組研究領域的一個突破性里程碑,

Source

]]>
12974
借助 NVIDIA BioNeMo Blueprint 加速蛋白質工程中的生成式蛋白質粘結劑設計 http://www.open-lab.net/zh-cn/blog/accelerate-protein-engineering-with-the-nvidia-bionemo-blueprint-for-generative-protein-binder-design/ Mon, 13 Jan 2025 09:43:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=12635 Continued]]> 設計一種能在藥物研發中專門結合標的治療性蛋白質是一項艱巨的挑戰。傳統工作流程通常是一個艱苦的試錯過程,需要對數千個候選項進行迭代,而每一輪合成和驗證都需要數月甚至數年的時間。考慮到人類蛋白質的平均長度為 430 個氨基酸,可能的設計數量相當于 位序列,實際上是無限量,遠遠超過宇宙中的原子數 ()。 用于生成式蛋白質粘結劑設計的 NVIDIA BioNeMo Blueprint 是藥物研發平臺的參考工作流,可幫助這些平臺使用生成式 AI 和 GPU 加速的微服務,以智能方式瀏覽這一龐大的搜索空間。系統不會進行強力猜測,而是會引導用戶找到結構受限的穩定粘結劑,從而大幅減少迭代次數并縮短發現時間。本文將展示藥物研發公司的研究人員如何在簡化的 GPU 加速工作流程中快速生成從初始標序列到經過驗證的穩定配合物的新型蛋白質粘結劑。 NVIDIA NIM 微服務 是模塊化的云原生組件,

Source

]]>
12635
評估 GenMol 作為用于分子生成的通用基礎模型 http://www.open-lab.net/zh-cn/blog/evaluating-genmol-as-a-generalist-foundation-model-for-molecular-generation/ Mon, 13 Jan 2025 09:31:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=12632 Continued]]> 傳統的計算藥物研發幾乎完全依賴于高度特定于任務的計算模型來識別命中率和優化潛在客戶。使這些專業模型適應新任務需要大量的時間、計算能力和專業知識,當研究人員同時跨多個目標或屬性開展工作時,這些挑戰就會增加。 雖然 專業模型 仍被廣泛使用,但多面手模型的興起點燃了人們的希望,即這些多功能框架可以獲得有用的 化學直覺 ,這意味著它們可以處理各種藥物研發任務,并發現專業模型往往忽視的解決方案和模式。 最近推出的 SAFE-GPT 模型通過引入與藥物化學家的分子設計方法一致的化學直觀框架,代表了 AI 驅動的分子生成的范式轉變。通過使用基于序列連接的片段嵌入 (Sequential Attachment-based Fragment Embedding, SAFE) 表征 (稍后將在本文中介紹),SAFE-GPT 解決了早期分子生成模型中的關鍵限制,

Source

]]>
12632
借助 GPU 加速的 MMseqs2 提升 AlphaFold2 蛋白質結構預測能力 http://www.open-lab.net/zh-cn/blog/boost-alphafold2-protein-structure-prediction-with-gpu-accelerated-mmseqs2/ Wed, 13 Nov 2024 07:40:09 +0000 http://www.open-lab.net/zh-cn/blog/?p=12052 Continued]]> 能夠比較多個相關蛋白質的序列是許多生命科學研究人員的一項基礎任務。這通常以多序列對齊(MSA)的形式完成,從這些對齊中檢索到的進化信息可以深入了解蛋白質結構、功能和進化歷史。 現在,借助更新的 GPU 加速進化信息檢索庫 MMseqs2-GPU,從蛋白質序列中獲取見解比以往更快。 簡而言之,MSA 是一個大矩陣,包含表示蛋白質序列中殘基(或氨基酸)的字母。矩陣的第一行包含“查詢”序列——用于分析的感興趣序列——每個殘基從左到右都放在一列中。 后續行表示相似的序列,從最相似到最不相似,包含與行中每列的查詢對齊的殘基。當沒有殘基與查詢序列匹配時,會在對齊中引入占位符差距,通常由“-”表示 (圖 1)。 圖 1. MSAs 捕獲有關比較序列的信息,可以使用序列徽標、條形圖等方法進行可視化和量化。 通過從包含數千個物種序列的蛋白質數據庫中檢索到的 MSAs 編碼的進化信息,

Source

]]>
12052
聚焦:Montai 利用 NVIDIA NIM 微服務構建用于藥物研發的多模態 AI 平臺 http://www.open-lab.net/zh-cn/blog/spotlight-montai-builds-a-multimodal-ai-platform-for-drug-discovery-using-nvidia-nim-microservices/ Thu, 26 Sep 2024 09:53:16 +0000 http://www.open-lab.net/zh-cn/blog/?p=11509 Continued]]> 藥物研發旨在開發新的治療藥物,這些藥物能夠有效地針對疾病,同時盡可能地減少對患者的副作用。使用多模態數據(例如分子結構、細胞圖像、序列和非結構化數據)對于識別新型安全的候選藥物非常重要。 然而,創建用于計算機輔助藥物研發的多模態 AI 模型具有挑戰性。這些模型必須調整各種類型的數據,并處理高度復雜的計算。多模態 AI 模型通常需要先進的深度學習技術,而這些技術的計算要求很高。確保這些模型有效地使用來自所有數據類型的信息而不引入偏差是一項主要困難。有關更多詳細信息,請參閱 《Toward Unified AI Drug Discovery with Multimodal Knowledge》。 Montai Therapeutics 是一家 旗艦先鋒公司 ,該公司正在使用 NVIDIA BioNeMo 平臺應對這些挑戰。Montai 創新的核心是整合和管理全球最大、

Source

]]>
11509
借助 Geneformer AI 模型,有限數據也能解鎖基因網絡 http://www.open-lab.net/zh-cn/blog/unlock-gene-networks-using-limited-data-with-ai-model-geneformer/ Mon, 15 Jul 2024 05:20:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=10655 Continued]]> Geneformer 是最近推出的 和功能強大的 AI 模型,可以通過從大量單細胞轉錄組數據中進行遷移學習來學習基因網絡動力學和相互作用。借助此工具,研究人員可以在數據有限的情況下準確預測基因行為和疾病機制,從而加速藥物目標的發現,并提高對各種生物學背景下復雜基因網絡的理解。 AI 模型 Geneformer 由麻省理工學院和哈佛大學博德研究所的研究人員及其合作者開發,該模型使用 sc-RNA 表達數據中表達最高的基因生成每個細胞的密集表示,這些表示可以用作各種下游預測任務的特征。然而,Geneformer 的獨特之處在于其架構所支持的功能,即使在使用很少的數據進行訓練時也是如此。 Geneformer 具有類似 BERT 的 Transformer 架構,并基于來自各種人體組織中大約 3000 萬個單細胞轉錄組的數據進行了預訓練。

Source

]]>
10655
針對藥物研發優化 OpenFold 訓練 http://www.open-lab.net/zh-cn/blog/optimizing-openfold-training-for-drug-discovery/ Wed, 28 Feb 2024 05:13:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=9009 Continued]]> 從氨基酸序列預測 3D 蛋白質結構一直是生物信息學領域由來已久的重要問題。近年來,基于深度學習的計算方法不斷涌現,并已顯示出有希望的結果。 在這些工作中,AlphaFold2 是第一種與較慢的基于物理性質的計算方法相美的方法。它被 Nature 命名為 2021 年度最佳方法。該模型基于其他當代深度學習模型廣泛采用的序列注意力機制的變體而構建。 通過使用 MML,我們能夠有效地訓練和評估大規模的生物醫學數據集。MML 是一個高度可擴展和可定制化的平臺,它支持多種機器學習算法和模型,并提供了豐富的工具和接口,以便于用戶能夠輕松地集成、擴展和定制化 MML 平臺以滿足其特定的需求和應用場景。 遺憾的是,AlphaFold2 訓練所需的時間仍然是一個重大瓶頸。 AlphaFold2 訓練使用 1000 萬個樣本和 128 個 TPU 進行,收時間超過 11 天(初始訓練 7 天,

Source

]]>
9009
新模型 MolMIM 和 DiffDock 助力 NVIDIA BioNeMo 中的分子生成和分子對接 http://www.open-lab.net/zh-cn/blog/new-models-molmim-and-diffdock-power-molecule-generation-and-molecular-docking-in-bionemo/ Mon, 08 Jan 2024 05:36:43 +0000 http://www.open-lab.net/zh-cn/blog/?p=8655 Continued]]> 在科學、技術和醫學的交叉領域,尋找可行的藥物是最艱巨的挑戰之一。從數學上講,隨機偶然發現一個好的治療候選者的可能性小得驚人。這主要是因為只有幾個原子可以通過大量的方法連接在一起,使初看起來像藥物一樣的化合物。 在對這些分子進行更深入的檢查后,絕大多數分子都會成為不適合的治療方法。臨床上可行的藥物必須具有多種特性或特性,如果缺少其中任何一種特性或特性或超出范圍,則可能會使藥物無效,甚至有毒。藥物獵人尋求的特性示例包括描述藥物的結合親和力、溶劑性、膜滲透性、分子量和穩定性的特性,等等。 從本質上講,候選藥物的追求是多目標優化問題。 生成式 AI 模型,例如 NVIDIA BioNeMo 中的 MolMIM,旨在直接解決尋找具有正確屬性的分子的挑戰。使用 MolMIM,研究人員可以生成分子,以最大限度地提高用戶指定的評分函數(簡稱 Oracle 函數)。

Source

]]>
8655
借助 HiFi-NN 在函數標記領域取得突破性進展 http://www.open-lab.net/zh-cn/blog/breakthrough-in-functional-annotation-with-hifi-nn/ Tue, 19 Dec 2023 04:47:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=8549 Continued]]> 從細胞新陳代謝到工業制造,酶是眾多過程的重要生物催化劑。應用人工智能生成酶是一個令人興奮的研究領域,可直接應用于生命科學。在這些科學挑戰中取得進展對于進一步推動藥物研發、環境科學和生物工程的發展至關重要。 目前,地球上大量生命形式中只有一小部分進行了測序,這阻礙了機器學習算法在序列設計的復雜領域中的廣泛應用和泛化。改進的功能標記方法是酶研究的重要組成部分,能夠識別和表征新發現的酶的功能。這是了解復雜的生物過程和增強用于生成工作流程的數據的關鍵。 基地營研究,一家位于倫敦的 Bio-AI 公司,同時也是 NVIDIA 初創加速計劃 的成員,最近利用 NVIDIA GPU 訓練出了一種層次微調的最近鄰方法(HiFi-NN)。這種方法在召回率、精確度和 F1 分數方面相較現有模型有顯著提升,在酶標注任務上比先進的 SoTA 方法高出 15% 以上。

Source

]]>
8549
使用 NVIDIA BioNeMo 框架訓練用于藥物研發的生成式 AI 模型 http://www.open-lab.net/zh-cn/blog/train-generative-ai-models-for-drug-discovery-with-bionemo-framework/ Wed, 29 Nov 2023 06:09:38 +0000 http://www.open-lab.net/zh-cn/blog/?p=8346 Continued]]> NVIDIA BioNeMo 框架已發布,現可在 NGC 上下載,使研究人員能夠在藥物研發應用中構建和部署生成式 AI、大型語言模型 (LLM) 和基礎模型。 BioNeMo 平臺包括托管服務、API 端點和訓練框架,可簡化、加速和擴展用于藥物研發的生成式 AI.BioNeMo 能夠通過大規模端到端加速預訓練或微調先進的模型。它可作為 NVIDIA DGX 云上的完全托管服務和 NVIDIA Base Command 平臺,也可作為可下載的框架,用于部署本地基礎架構和各種云平臺。 這為藥物研發人員和開發者提供了一種快速輕松的方法,以便在從標識別到潛在客戶優化的整個藥物研發流程中構建和集成先進的 AI 應用。 NVIDIA BioNeMo 為多個領域的生成式 AI 模型提供優化。BioNeMo 框架 v1.0 提供優化的模型架構和工具,

Source

]]>
8346
NVIDIA 宣布為語言、視覺內容和生物學應用提供生成式人工智能服務 http://www.open-lab.net/zh-cn/blog/nvidia-announces-generative-ai-services-for-language-visual-content-and-biology-applications/ Wed, 22 Mar 2023 06:25:48 +0000 http://www.open-lab.net/zh-cn/blog/?p=6521 Continued]]> 生成式人工智能 已經做好了改變世界產業和解決當今最重要挑戰的準備。為了使企業能夠利用生成人工智能的可能性, NVIDIA 推出了 NVIDIA AI Foundations 和 NVIDIA NeMo 框架,由 NVIDIA DGX Cloud 提供支持。 NVIDIA AI Foundations 是一系列云服務,為企業提供了一種簡化的方法來構建和運行自定義生成人工智能,從文本語言、視覺媒體和生物語言的最先進的基礎模型開始。 NeMo 框架使企業能夠輕松開發大規模生成性人工智能語言和生物模型,并對其進行訓練、定制和部署到生產中。 觀看 NVIDIA GTC 2023 主題演講 與 NVIDIA 首席執行官黃仁勛( Jensen Huang )一起了解 NVIDIA 最新發布的生成性人工智能。 NVIDIA 宣布推出 NeMo ,

Source

]]>
6521
利用 NVIDIA BioNeMo 服務構建用于藥物發現的生成人工智能管道 http://www.open-lab.net/zh-cn/blog/build-generative-ai-pipelines-for-drug-discovery-with-bionemo-service/ Tue, 21 Mar 2023 07:27:39 +0000 http://www.open-lab.net/zh-cn/blog/?p=6561 Continued]]> 創造新的候選藥物是一項英勇的努力,通常需要 10 多年的時間才能將一種藥物推向市場。理解生物學和化學文本的新的超級計算規模的大型語言模型( LLM )正在幫助科學家理解蛋白質、小分子、 DNA 和生物醫學文本。 這些最先進的人工智能模型有助于生成 de novo 蛋白質和分子,并預測蛋白質的 3D 結構。他們可以預測小分子與蛋白質的結合結構,并為科學家提供更容易的方法來設計新的候選藥物,最終為患者帶來希望。 2021 Exscientia brought an AI-designed drug candidate 進行臨床試驗后,其他幾家公司宣布他們的候選人正在試驗中。在專注于基于人工智能的發現的制藥公司中,有關于 160 discovery programs 的公開信息,據報道其中 15 種產品正在臨床開發中。

Source

]]>
6561
人人超碰97caoporen国产