Kyle Tretina – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Fri, 21 Mar 2025 09:06:53 +0000
zh-CN
hourly
1
196178272 -
利用 Oracles 和實驗反饋指導生成式分子設計
http://www.open-lab.net/zh-cn/blog/guiding-generative-molecular-design-with-experimental-feedback-using-oracles/
Wed, 19 Mar 2025 08:56:53 +0000
http://www.open-lab.net/zh-cn/blog/?p=13266
Continued]]>
AI 生成化學有可能徹底改變科學家在藥物研發、健康以及材料科學和工程領域的工作方式。研究人員無需借助“化學直覺”手動設計分子或篩選數百萬種現有化學物質,而是可以訓練神經網絡來提出適合所需特性的新型分子結構。這種能力開辟了廣闊的化學空間,這是以前無法系統探索的。 雖然一些早期成功表明,生成式 AI 有望通過提出化學家可能沒有考慮過的創造性解決方案來加速創新,但這些成功只是一個開始。生成式 AI 還不是分子設計的靈丹妙藥,將 AI 建議的分子轉化為現實世界通常比 一些標題所顯示的困難得多 。 虛擬設計與現實世界影響之間的差距是當今 AI 驅動的分子設計面臨的核心挑戰。計算生成式化學模型需要實驗反饋和分子模擬來確認其設計的分子是否穩定、可合成且具有功能性。與自駕駛汽車一樣,AI 必須經過真實駕駛數據或高保真模擬的訓練和驗證,才能在不可預測的道路上行駛。
Source
]]>
13266
-
利用 Evo 2 以全新規模跨進化研究生命生物分子的語言
http://www.open-lab.net/zh-cn/blog/understanding-the-language-of-lifes-biomolecules-across-evolution-at-a-new-scale-with-evo-2/
Wed, 19 Feb 2025 04:52:15 +0000
http://www.open-lab.net/zh-cn/blog/?p=12974
Continued]]>
AI 已從實驗好奇心發展為生物學研究的驅動力。 深度學習算法、海量組學數據集和自動化實驗室工作流程的融合使 科學家能夠解決一度被認為棘手的問題 (從快速蛋白質結構預測到生成式藥物設計),從而增加了科學家對 AI 素養的需求。在這一勢頭下,我們正處于下一次范式轉變的邊緣:專為生物學打造的強大 AI 基礎模型的出現。 這些新模型有望將不同的數據源 (基因組序列、RNA 和蛋白質組譜,在某些情況下還包括科學文獻) 統一為分子、細胞和系統級別上對生命的統一、一致的理解。學習生物學的語言和結構為變革性應用打開了大門,例如更智能的藥物發現、合理的酶設計和疾病機制闡明。 在我們為下一波 AI 驅動的突破做好準備之際,這些基礎模型顯然不僅能夠加速進展,還將重新定義生物學研究的可能性。 2024 年 11 月推出的 首個 Evo 模型 是基因組研究領域的一個突破性里程碑,
Source
]]>
12974
-
借助 NVIDIA BioNeMo Blueprint 加速蛋白質工程中的生成式蛋白質粘結劑設計
http://www.open-lab.net/zh-cn/blog/accelerate-protein-engineering-with-the-nvidia-bionemo-blueprint-for-generative-protein-binder-design/
Mon, 13 Jan 2025 09:43:07 +0000
http://www.open-lab.net/zh-cn/blog/?p=12635
Continued]]>
設計一種能在藥物研發中專門結合標的治療性蛋白質是一項艱巨的挑戰。傳統工作流程通常是一個艱苦的試錯過程,需要對數千個候選項進行迭代,而每一輪合成和驗證都需要數月甚至數年的時間。考慮到人類蛋白質的平均長度為 430 個氨基酸,可能的設計數量相當于 位序列,實際上是無限量,遠遠超過宇宙中的原子數 ()。 用于生成式蛋白質粘結劑設計的 NVIDIA BioNeMo Blueprint 是藥物研發平臺的參考工作流,可幫助這些平臺使用生成式 AI 和 GPU 加速的微服務,以智能方式瀏覽這一龐大的搜索空間。系統不會進行強力猜測,而是會引導用戶找到結構受限的穩定粘結劑,從而大幅減少迭代次數并縮短發現時間。本文將展示藥物研發公司的研究人員如何在簡化的 GPU 加速工作流程中快速生成從初始標序列到經過驗證的穩定配合物的新型蛋白質粘結劑。 NVIDIA NIM 微服務 是模塊化的云原生組件,
Source
]]>
12635
-
評估 GenMol 作為用于分子生成的通用基礎模型
http://www.open-lab.net/zh-cn/blog/evaluating-genmol-as-a-generalist-foundation-model-for-molecular-generation/
Mon, 13 Jan 2025 09:31:41 +0000
http://www.open-lab.net/zh-cn/blog/?p=12632
Continued]]>
傳統的計算藥物研發幾乎完全依賴于高度特定于任務的計算模型來識別命中率和優化潛在客戶。使這些專業模型適應新任務需要大量的時間、計算能力和專業知識,當研究人員同時跨多個目標或屬性開展工作時,這些挑戰就會增加。 雖然 專業模型 仍被廣泛使用,但多面手模型的興起點燃了人們的希望,即這些多功能框架可以獲得有用的 化學直覺 ,這意味著它們可以處理各種藥物研發任務,并發現專業模型往往忽視的解決方案和模式。 最近推出的 SAFE-GPT 模型通過引入與藥物化學家的分子設計方法一致的化學直觀框架,代表了 AI 驅動的分子生成的范式轉變。通過使用基于序列連接的片段嵌入 (Sequential Attachment-based Fragment Embedding, SAFE) 表征 (稍后將在本文中介紹),SAFE-GPT 解決了早期分子生成模型中的關鍵限制,
Source
]]>
12632
-
NVIDIA cuEquivariance 數學庫助力藥物和材料研發加速
http://www.open-lab.net/zh-cn/blog/accelerate-drug-and-material-discovery-with-new-math-library-nvidia-cuequivariance/
Mon, 18 Nov 2024 07:35:26 +0000
http://www.open-lab.net/zh-cn/blog/?p=11934
Continued]]>
用于科學的 AI 模型通常經過訓練,可以預測自然界的運作方式,例如預測生物分子的結構或可能成為下一種電池材料的新固態的性質。這些任務需要高精度和準確性。科學領域的 AI 更具挑戰性的原因在于,高度準確和精確的科學數據往往稀缺,這與從多個資源中大量獲取的文本和圖像不同。 鑒于對解決方案的高需求和有限的資源,研究人員轉而采用創新方法,例如將自然法則嵌入 AI 模型中,提高其準確性以及減少對數據的依賴。 去年取得成功的一種方法是將科學問題的對稱性嵌入 AI 模型。這些神經網絡架構在等變神經網絡(Equivariant Neural Networks,ENN)下廣受歡迎,使用對稱相關變換下的等變數學概念構建而成。 簡而言之,ENN 旨在了解問題的基本對稱性。例如,如果 ENN 的輸入進行了旋轉,輸出也將相應旋轉。這意味著,即使以不同的方向呈現,模型也可以識別相同的物體或圖案。
Source
]]>
11934
-
借助 GPU 加速的 MMseqs2 提升 AlphaFold2 蛋白質結構預測能力
http://www.open-lab.net/zh-cn/blog/boost-alphafold2-protein-structure-prediction-with-gpu-accelerated-mmseqs2/
Wed, 13 Nov 2024 07:40:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=12052
Continued]]>
能夠比較多個相關蛋白質的序列是許多生命科學研究人員的一項基礎任務。這通常以多序列對齊(MSA)的形式完成,從這些對齊中檢索到的進化信息可以深入了解蛋白質結構、功能和進化歷史。 現在,借助更新的 GPU 加速進化信息檢索庫 MMseqs2-GPU,從蛋白質序列中獲取見解比以往更快。 簡而言之,MSA 是一個大矩陣,包含表示蛋白質序列中殘基(或氨基酸)的字母。矩陣的第一行包含“查詢”序列——用于分析的感興趣序列——每個殘基從左到右都放在一列中。 后續行表示相似的序列,從最相似到最不相似,包含與行中每列的查詢對齊的殘基。當沒有殘基與查詢序列匹配時,會在對齊中引入占位符差距,通常由“-”表示 (圖 1)。 圖 1. MSAs 捕獲有關比較序列的信息,可以使用序列徽標、條形圖等方法進行可視化和量化。 通過從包含數千個物種序列的蛋白質數據庫中檢索到的 MSAs 編碼的進化信息,
Source
]]>
12052
-
借助 Geneformer AI 模型,有限數據也能解鎖基因網絡
http://www.open-lab.net/zh-cn/blog/unlock-gene-networks-using-limited-data-with-ai-model-geneformer/
Mon, 15 Jul 2024 05:20:21 +0000
http://www.open-lab.net/zh-cn/blog/?p=10655
Continued]]>
Geneformer 是最近推出的 和功能強大的 AI 模型,可以通過從大量單細胞轉錄組數據中進行遷移學習來學習基因網絡動力學和相互作用。借助此工具,研究人員可以在數據有限的情況下準確預測基因行為和疾病機制,從而加速藥物目標的發現,并提高對各種生物學背景下復雜基因網絡的理解。 AI 模型 Geneformer 由麻省理工學院和哈佛大學博德研究所的研究人員及其合作者開發,該模型使用 sc-RNA 表達數據中表達最高的基因生成每個細胞的密集表示,這些表示可以用作各種下游預測任務的特征。然而,Geneformer 的獨特之處在于其架構所支持的功能,即使在使用很少的數據進行訓練時也是如此。 Geneformer 具有類似 BERT 的 Transformer 架構,并基于來自各種人體組織中大約 3000 萬個單細胞轉錄組的數據進行了預訓練。
Source
]]>
10655
人人超碰97caoporen国产