藥物研發 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 21 Mar 2025 09:06:53 +0000 zh-CN hourly 1 196178272 利用 Oracles 和實驗反饋指導生成式分子設計 http://www.open-lab.net/zh-cn/blog/guiding-generative-molecular-design-with-experimental-feedback-using-oracles/ Wed, 19 Mar 2025 08:56:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=13266 Continued]]> AI 生成化學有可能徹底改變科學家在藥物研發、健康以及材料科學和工程領域的工作方式。研究人員無需借助“化學直覺”手動設計分子或篩選數百萬種現有化學物質,而是可以訓練神經網絡來提出適合所需特性的新型分子結構。這種能力開辟了廣闊的化學空間,這是以前無法系統探索的。 雖然一些早期成功表明,生成式 AI 有望通過提出化學家可能沒有考慮過的創造性解決方案來加速創新,但這些成功只是一個開始。生成式 AI 還不是分子設計的靈丹妙藥,將 AI 建議的分子轉化為現實世界通常比 一些標題所顯示的困難得多 。 虛擬設計與現實世界影響之間的差距是當今 AI 驅動的分子設計面臨的核心挑戰。計算生成式化學模型需要實驗反饋和分子模擬來確認其設計的分子是否穩定、可合成且具有功能性。與自駕駛汽車一樣,AI 必須經過真實駕駛數據或高保真模擬的訓練和驗證,才能在不可預測的道路上行駛。

Source

]]>
13266
利用 Evo 2 以全新規模跨進化研究生命生物分子的語言 http://www.open-lab.net/zh-cn/blog/understanding-the-language-of-lifes-biomolecules-across-evolution-at-a-new-scale-with-evo-2/ Wed, 19 Feb 2025 04:52:15 +0000 http://www.open-lab.net/zh-cn/blog/?p=12974 Continued]]> AI 已從實驗好奇心發展為生物學研究的驅動力。 深度學習算法、海量組學數據集和自動化實驗室工作流程的融合使 科學家能夠解決一度被認為棘手的問題 (從快速蛋白質結構預測到生成式藥物設計),從而增加了科學家對 AI 素養的需求。在這一勢頭下,我們正處于下一次范式轉變的邊緣:專為生物學打造的強大 AI 基礎模型的出現。 這些新模型有望將不同的數據源 (基因組序列、RNA 和蛋白質組譜,在某些情況下還包括科學文獻) 統一為分子、細胞和系統級別上對生命的統一、一致的理解。學習生物學的語言和結構為變革性應用打開了大門,例如更智能的藥物發現、合理的酶設計和疾病機制闡明。 在我們為下一波 AI 驅動的突破做好準備之際,這些基礎模型顯然不僅能夠加速進展,還將重新定義生物學研究的可能性。 2024 年 11 月推出的 首個 Evo 模型 是基因組研究領域的一個突破性里程碑,

Source

]]>
12974
借助 AI 驅動的細胞分析技術推進罕見疾病檢測 http://www.open-lab.net/zh-cn/blog/advancing-rare-disease-detection-with-ai-powered-cellular-profiling/ Wed, 29 Jan 2025 05:31:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=12913 Continued]]> 由于傳統基因組測序的局限性,罕見疾病很難診斷。哥倫比亞大學助理教授 Wolfgang Pernice 正在使用 AI 驅動的細胞分析來彌合這些差距,并推動個性化醫療的發展。 在 NVIDIA GTC 2024 大會上,Pernice 分享了他的實驗室對 Charcot-Marie-Tooth (CMT) 和線粒體疾病等疾病的研究成果。他的團隊開發了 CellNet,這是一種 AI 驅動的系統,使用患者細胞的高分辨率圖像來識別與疾病相關的細微模式,從而實現準確診斷并制定新的治療策略。 基因組醫學一直致力于將診斷轉化為個性化的治療或治療方法。雖然取得了一些進展,但許多患有 7,000 種已知罕見遺傳病之一的患者仍然需要有效的治療方法。Pernice 的實驗室正在利用計算機視覺和深度學習來解決罕見疾病診斷和治療中的主要障礙,從而致力于更快速、更可擴展的基因組醫學方法。

Source

]]>
12913
借助 NVIDIA BioNeMo Blueprint 加速蛋白質工程中的生成式蛋白質粘結劑設計 http://www.open-lab.net/zh-cn/blog/accelerate-protein-engineering-with-the-nvidia-bionemo-blueprint-for-generative-protein-binder-design/ Mon, 13 Jan 2025 09:43:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=12635 Continued]]> 設計一種能在藥物研發中專門結合標的治療性蛋白質是一項艱巨的挑戰。傳統工作流程通常是一個艱苦的試錯過程,需要對數千個候選項進行迭代,而每一輪合成和驗證都需要數月甚至數年的時間。考慮到人類蛋白質的平均長度為 430 個氨基酸,可能的設計數量相當于 位序列,實際上是無限量,遠遠超過宇宙中的原子數 ()。 用于生成式蛋白質粘結劑設計的 NVIDIA BioNeMo Blueprint 是藥物研發平臺的參考工作流,可幫助這些平臺使用生成式 AI 和 GPU 加速的微服務,以智能方式瀏覽這一龐大的搜索空間。系統不會進行強力猜測,而是會引導用戶找到結構受限的穩定粘結劑,從而大幅減少迭代次數并縮短發現時間。本文將展示藥物研發公司的研究人員如何在簡化的 GPU 加速工作流程中快速生成從初始標序列到經過驗證的穩定配合物的新型蛋白質粘結劑。 NVIDIA NIM 微服務 是模塊化的云原生組件,

Source

]]>
12635
評估 GenMol 作為用于分子生成的通用基礎模型 http://www.open-lab.net/zh-cn/blog/evaluating-genmol-as-a-generalist-foundation-model-for-molecular-generation/ Mon, 13 Jan 2025 09:31:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=12632 Continued]]> 傳統的計算藥物研發幾乎完全依賴于高度特定于任務的計算模型來識別命中率和優化潛在客戶。使這些專業模型適應新任務需要大量的時間、計算能力和專業知識,當研究人員同時跨多個目標或屬性開展工作時,這些挑戰就會增加。 雖然 專業模型 仍被廣泛使用,但多面手模型的興起點燃了人們的希望,即這些多功能框架可以獲得有用的 化學直覺 ,這意味著它們可以處理各種藥物研發任務,并發現專業模型往往忽視的解決方案和模式。 最近推出的 SAFE-GPT 模型通過引入與藥物化學家的分子設計方法一致的化學直觀框架,代表了 AI 驅動的分子生成的范式轉變。通過使用基于序列連接的片段嵌入 (Sequential Attachment-based Fragment Embedding, SAFE) 表征 (稍后將在本文中介紹),SAFE-GPT 解決了早期分子生成模型中的關鍵限制,

Source

]]>
12632
借助 GPU 加速的 MMseqs2 提升 AlphaFold2 蛋白質結構預測能力 http://www.open-lab.net/zh-cn/blog/boost-alphafold2-protein-structure-prediction-with-gpu-accelerated-mmseqs2/ Wed, 13 Nov 2024 07:40:09 +0000 http://www.open-lab.net/zh-cn/blog/?p=12052 Continued]]> 能夠比較多個相關蛋白質的序列是許多生命科學研究人員的一項基礎任務。這通常以多序列對齊(MSA)的形式完成,從這些對齊中檢索到的進化信息可以深入了解蛋白質結構、功能和進化歷史。 現在,借助更新的 GPU 加速進化信息檢索庫 MMseqs2-GPU,從蛋白質序列中獲取見解比以往更快。 簡而言之,MSA 是一個大矩陣,包含表示蛋白質序列中殘基(或氨基酸)的字母。矩陣的第一行包含“查詢”序列——用于分析的感興趣序列——每個殘基從左到右都放在一列中。 后續行表示相似的序列,從最相似到最不相似,包含與行中每列的查詢對齊的殘基。當沒有殘基與查詢序列匹配時,會在對齊中引入占位符差距,通常由“-”表示 (圖 1)。 圖 1. MSAs 捕獲有關比較序列的信息,可以使用序列徽標、條形圖等方法進行可視化和量化。 通過從包含數千個物種序列的蛋白質數據庫中檢索到的 MSAs 編碼的進化信息,

Source

]]>
12052
基于高吞吐量 AI 的藥物發現流程優化 http://www.open-lab.net/zh-cn/blog/high-throughput-ai-driven-drug-discovery-pipeline/ Wed, 30 Oct 2024 09:54:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=11855 Continued]]> 將人工智能集成到藥物開發中正在徹底改變研究人員開發各種疾病新療法的方式。傳統方法通常耗時且成本高昂,將新藥推向市場的過程長達 15 年,成本在 10 億美元至 20 億美元之間。 通過使用人工智能和高級計算工具,研究人員現在可以加速新藥的識別,顯著減少藥物研發過程中所涉及的時間和成本。 在傳統的藥物研發工作流程中,研究人員首先識別生物標的(例如參與疾病進展的蛋白質),然后尋找能夠調節該標的分子。生物系統的復雜性,加上大量潛在的化學結構(估計約為 10^60),使得這項任務非常艱巨。 傳統的計算機輔助藥物研發 (CADD) 方法通常依賴于簡化模型和假設,而這些模型和假設無法捕捉藥物與目標蛋白的相互作用的復雜性,從而導致臨床試驗中的高失敗率。 Innoplexus 是一家注冊的 NVIDIA Inception 初創公司 。

Source

]]>
11855
利用 CUDA 圖形、Coroutines 和 GPU 工作流程加速藥物發現進程 http://www.open-lab.net/zh-cn/blog/optimizing-drug-discovery-with-cuda-graphs-coroutines-and-gpu-workflows/ Wed, 23 Oct 2024 05:28:03 +0000 http://www.open-lab.net/zh-cn/blog/?p=11700 Continued]]> 藥物研究需要快速、高效的模擬來預測分子如何相互作用,從而加速藥物研發。NVIDIA 高級開發者技術工程師 Jiqun Tu 和 Schrödinger Desmond 引擎技術負責人 Ellery Russell 將探索旨在加速分子動力學模擬的高級 GPU 優化技術。 在這場 NVIDIA GTC 2024 會議中,他們提出了提高工作負載效率和吞吐量的實用策略,為藥物研究人員提供了增強計算藥物研發的工具。這些策略基于現有的 CUDA 工作流,涵蓋了 CUDA Graphs、C++ coroutines 和 mapped memory 等創新技術,可克服擴展挑戰和瓶頸。 請關注我們,并獲取 會議的 PDF 文件 ,該文件為與會者提供切實可行的技術,以優化性能、最大限度地降低延遲,并充分利用 GPU 功能進行分子模擬。主題包括: CUDA 圖形:

Source

]]>
11700
AI 借助零采樣學習發現罕見疾病的現有治療藥物 http://www.open-lab.net/zh-cn/blog/ai-uses-zero-shot-learning-to-find-existing-drugs-for-treating-rare-diseases/ Wed, 02 Oct 2024 08:39:44 +0000 http://www.open-lab.net/zh-cn/blog/?p=11477 Continued]]> 突破性的藥物再利用 AI 模型可以為醫生和患者帶來新的希望,讓他們嘗試在現有治療方案有限或根本沒有的情況下治療疾病。這個名為 TxGNN 的零樣本工具可幫助醫生找到現有藥物的新用途,以治療原本可能無法治療的病癥。 這項研究 最近發表在 《自然醫學》 上,由哈佛大學的科學家領導,可能會減少藥物研發的時間和成本,從而更快地為患者提供有效的治療。 哈佛大學醫學院 Blavatnik 研究所生物醫學信息學助理教授兼 Kempner 研究所副教授 Marinka Zitnik 在 最近的一篇新聞文章 中表示:“借助此工具,我們的目標是在各個疾病領域確定新的治療方法,但對于罕見、極為罕見和被忽略的疾病,我們預計該模型可以幫助縮小或至少縮小造成嚴重健康差距的差距。” 全球有超過 3 億人患有 7000 多種罕見或未確診疾病。在這些罕見疾病中,大約 7%

Source

]]>
11477
針對藥物研發優化 OpenFold 訓練 http://www.open-lab.net/zh-cn/blog/optimizing-openfold-training-for-drug-discovery/ Wed, 28 Feb 2024 05:13:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=9009 Continued]]> 從氨基酸序列預測 3D 蛋白質結構一直是生物信息學領域由來已久的重要問題。近年來,基于深度學習的計算方法不斷涌現,并已顯示出有希望的結果。 在這些工作中,AlphaFold2 是第一種與較慢的基于物理性質的計算方法相美的方法。它被 Nature 命名為 2021 年度最佳方法。該模型基于其他當代深度學習模型廣泛采用的序列注意力機制的變體而構建。 通過使用 MML,我們能夠有效地訓練和評估大規模的生物醫學數據集。MML 是一個高度可擴展和可定制化的平臺,它支持多種機器學習算法和模型,并提供了豐富的工具和接口,以便于用戶能夠輕松地集成、擴展和定制化 MML 平臺以滿足其特定的需求和應用場景。 遺憾的是,AlphaFold2 訓練所需的時間仍然是一個重大瓶頸。 AlphaFold2 訓練使用 1000 萬個樣本和 128 個 TPU 進行,收時間超過 11 天(初始訓練 7 天,

Source

]]>
9009
人人超碰97caoporen国产