使用 AI 的研究人員正在挖掘長毛猛象和巨型樹懶等早已絕跡的物種的 DNA,尋找古代基因組學的秘密,以幫助對抗當今最具感染力的病原體。
根據世界衛生組織(WHO)的數據,全球每年有超過 125 萬人死于對抗生素等藥物有免疫力的感染。到 2050 年,這一數字可能上升到 1000 萬人。此外,在 6 年內,由于治療傳染病的高昂費用,大約 2400 萬人可能會陷入極端貧困。
Cesar de la Fuente 博士是賓夕法尼亞大學的教授,他領導著一個研究團隊,利用人工智能從已絕跡的史前生物中探測 DNA,以確定危險的耐藥微生物的新解決方案。
2024 年 6 月,de la Fuente 博士和一個團隊在《自然生物醫學工程》( Nature Biomedical Engineering ) 上發表的一篇論文中詳細介紹了這項技術,并將其稱為“分子去滅絕”。
“在整個進化過程中探索和比較分子可以獲得新的生物學見解,”德拉富恩特博士說,“我們的 AI 驅動的分子去滅工作讓我們能夠帶回過去的分子,幫助應對當代挑戰。”

使用一組NVIDIA A100 GPUs,de la Fuente 博士和他在賓夕法尼亞州大學機器生物學團隊的團隊訓練了一套深度學習模型,以挖掘活體和滅絕物種的蛋白質組。科學家們假設,當今花費了幾十年時間適應和對抗現代藥物的病原體可能會受到隱藏在滅絕生物的古代基因組中的抗菌防御的影響。
研究人員對 40 種名為 APEX 的深度學習模型進行了訓練,這些模型的 DNA 取自已絕跡的熊和企鵝的化石、古代的木蘭樹、直牙象、海牛、巨型麋鹿、毛絨猛犸和巨型樹懶的化石。
該訓練使用了研究人員在內部創建的 988 個肽,以及分別為 5093 個和 5500 個公開可用的抗菌肽(AMP)和非抗菌肽。研究人員指出,內部數據集包含從 34 種細菌中獲取的 14738 個抗菌活動數據值。
研究人員使用 cuDNN-加速的 PyTorch 深度學習框架和單個 NVIDIA A100 GPU 進行訓練。
訓練后,模型預測了加密的肽序列,即免疫系統用來對抗感染的蛋白質片段。
具體來說,APEX 預測了超過 37,000 個具有廣泛抗菌應用的肽序列;其中 11,000 個沒有在活生物體中發現,這意味著它們的起源或基因組靈感來自于已滅絕的生物。
研究人員縮小了數據范圍,然后從 APEX 生成的肽中合成了 69 種潛在的抗生素。
在實驗室測試中,小鼠感染了通常會感染人類燒傷患者的細菌病原體,這些古老的、復活的肽能夠對抗當代感染。
研究人員發現,使用源自巨樹突的實驗性抗生素(名為 mylodonin-2)的小鼠在開始治療后 2 天內健康狀況得到改善。事實上,使用這種樹突衍生藥物治療的小鼠的改善速度與使用常見抗生素 Polymyxin 治療的對照組小鼠相同。
de la Fuente 博士說:“通過探索已絕跡的有機體,我們可以接觸到當代病原體從未遇到過的大量分子。分子去滅絕可以提供新的化合物庫,以對抗人類面臨的最大威脅之一的抗微生物藥物耐藥性。”
研究人員在論文中指出,已絕跡的抗菌分子通過使病原體細胞的內膜去極化來攻擊微生物,這與之前描述的大多數抗菌肽不同。
研究人員承認,這種從絕種生物中回收 DNA 的新方法似乎取自邁克爾·克萊頓的驚悚片。直到最近,隨著圖形處理單元、并行工作負載和人工智能的廣泛應用,這一過程幾乎是不可能的。

de la Fuente 博士認為,生成式 AI 有可能徹底改變傳統和新型藥物研發方法的各個方面。
使用傳統方法(包括 wetlabs 和 CPU 驅動的計算機)開發一種新的抗菌藥物可能需要 10 到 15 年的時間,成本超過 10 億美元。根據 de la Fuente 博士的說法,通過使用生成式 AI,可以顯著減少成本和開發時間。
“GPU 正在改變我們在實驗室中的工作方式,”Dr. de la Fuente 博士說,“過去需要 6 年的研究才能完成的工作,我們可以在幾個小時內完成。這使我們能夠大幅加速抗生素的發現。這就像將科幻小說變為現實。”
de la Fuente 博士正處于成立一家公司的早期階段,該公司可以將其研究團隊發現的最具前景的抗菌藥物推向市場。機器生物學團隊繼續使用其 APEX 模型來探索有前景的抗菌肽,可以幫助人類對抗耐藥性病原體。這項工作在 GitHub 上是開源的。
閱讀《Nature》中的論文。
查看 Dr. de la Fuente 博士實驗室的更多研究成果。
?
?