• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 計算機視覺/視頻分析

    與 Jonny Israel 進行人工智能和藥物發現問答:NVIDIA 基因組學

    下面的帖子將深入探討NVIDIA 在藥物發現和基因組學方面取得的一些成就和當前的工作重點。作為醫療保健和生命科學領域創新的領導者,NVIDIA 正在尋求加入人工智能、深度學習、模擬和藥物發現 研究人員和工程師 為球隊干杯。如果你讀到的內容與你的職業目標一致,請查看當前的工作公告。

    NVIDIA 正在利用最新技術,將高性能計算( HPC )與基因組和藥物發現研究結合起來。隨著基因組測試變得越來越主流,需要分析的數據量也在增加。藥物發現也進入了一個新的研究時代,人工智能和深度學習為發現數千種新化合物打開了大門,這些化合物是藥物發現的基礎。

    NVIDIA 的研究人員和工程師,如該組織的負責人約翰尼·伊斯雷爾,正在推動基因組學和藥物發現研究。開發 NVIDIA Clara Parabricks 等軟件,這是一個 GPU 加速的計算基因組學應用框架,為全基因組、外顯子組、癌癥基因組和 RNA 測序數據提供端到端分析工作流。

    作為NVIDIA 研究公司內容營銷部的負責人,我和約翰尼坐下來進一步了解他在團隊中的工作。

    嘿,約翰尼,很高興終于和你聯系上了。讓我們直接跳進去。我想問,鑒于NVIDIA 是一家科技公司,在你們團隊工作與在生物科技公司工作有什么不同?

    內特,謝謝你的幫助。有幾種方法可以考慮這些差異。在生物技術領域,往往有一個非常具體的技術目標或問題。你可以使用任何一種技術或技術組合來解決這個問題。你可能會與問題或目標結為夫妻,但不會與你可能使用的技術類型結為夫妻。在這里,我們追求的產品充分利用了我們在加速計算和人工智能技術方面的專業知識,并在產品目標方面具有更大的靈活性。

    例如,幾年前我們致力于基因組學,但我們沒有為藥物發現制造任何產品。今天,我們正在為這一特定領域打造一款產品。原因是藥物發現作為一個領域正在發生變化。我們看到了一個追求新目標的機會。因此,我想說,我們在追求新機會方面有著良好的記錄,因為我們獨特的定位和獨特的技能可以提供這些機會。

    你能給我舉一個獨特的機會的例子,讓你有別于傳統的生物技術公司嗎?

    我想強調一下我們面向人工智能的藥物發現工作的強度。藥物發現領域有不少公司與人工智能合作,但投資的水平和重點可能有所不同。對于生物技術公司來說,人工智能是在更廣泛的技術庫中尋求藥物發現項目的幾種技術選項之一。

    在NVIDIA ,我們知道我們在人工智能和加速計算方面有著獨特的優勢。因此,由于我們的定位和規模,我們比大多數其他公司更有動力以更高的強度和專注度投資這項工作。因此,對人工智能和藥物發現以及并行計算的交叉感興趣的工程師和科學家會發現我們的工作領域很有趣。

    你提到了你在基因組學方面的工作,你能告訴我你過去在基因組學方面的工作是如何影響你目前在藥物發現方面的工作的嗎?

    藥物發現領域是多學科的,是一個漫長而復雜的過程。藥物發現過程的早期階段是目標識別階段。大多數藥物發現工作都是基于目標的藥物發現工作流程,在這里,你可以找出目標是什么,蛋白質目標是什么,然后開發一種藥物。

    Genomes can quickly and effectively be annotated to help users with more information.Genomes can quickly and effectively be annotated to help users with more information.
    圖 1 。 NVIDIA Clara 對測序器分析的數據進行注釋。

    我們的基因組學工作極大地促進了目標識別問題。你可以在許多人身上建立這些全基因組的數據集,然后對它們進行分析,找出哪些突變與不同類型的疾病有關。通過識別和分析這些突變,我們可以找出與特定疾病相關的蛋白質靶點。然后從那里構建藥物發現工作流程的其余部分。

    因此,我們使用名為 NVIDIA Clara Parabricks 的軟件來繪制基因組學儀器的數據,識別基因組變異,并對它們進行注釋。通過將這些基因組學工作流程簡化為按鈕式軟件解決方案并加速該軟件,我們正在減少生成大規模基因組學數據集的時間和成本。這些跨多個個體的大規模基因組數據集隨后被用于確定可能影響疾病結果的蛋白質靶標,這些蛋白質的結構與我們的 NVIDIA Clara 發現軟件一起用于生成和模擬藥物化合物及其與這些蛋白質的相互作用。

    所以你用 Clara Parabricks 來推動基因組學中的蛋白質鑒定,然后用 Clara 發現來模擬可能被用作藥物的化合物?

    確切地說,在藥物發現的背景下,我們幫助找出特定藥物發現項目中最有希望的化合物,這是我們非常激動的事情。我們大約在一年半前開始研究藥物發現。我們在 GTC 上宣布——我相信是在 2020 年秋天——我們將開發這個名為 NVIDIA Clara 發現 它將成為一個 NVIDIA 框架,涵蓋所有與計算藥物發現有關的內容。這就是所有這些前沿工作發生的地方,也是我們目前真正想要招聘的地方。

    你想深入研究一下嗎?如果我們正在尋找這一領域的工程師和研究人員,他們可能會發現了解更多關于你關注的工作很有趣。

    當然,是的。藥物發現是一個漫長而復雜的過程,涉及多個學科。當你想到計算藥物發現時,有三種動態正在發生,它們可能會從計算的角度重塑這個行業。這三個動力學是你在計算藥物發現循環的核心所要做的。你有一種蛋白質——一個目標——你想影響它,你有一種化合物,它可能是一種有待開發的藥物。然后給定一種化合物和蛋白質結構,你可以進行各種模擬。你試圖預測這是否是一次有用的互動。

    Using the power of NVIDIA's AI and GPUs, NVIDIA Clara can simulate compounds for drug discovery.Using the power of NVIDIA's AI and GPUs, NVIDIA Clara can simulate compounds for drug discovery.
    圖 2 。用戶只需點擊 NVIDIA Clara 即可生成化合物

    傳統上,你會有一個這些化合物的數據庫。各種各樣的公司都在對這些數據庫進行編目和生產,如今有數十億種化合物。然后是蛋白質結構的世界,這是由一群從事結構生物學工作的小組產生的。

    現在,有三件事正在發生,我們認為它們可能會改變一切。首先是 DeepMind 和其他團體以字母折疊等形式進行的突破性工作。我們現在使用深度學習來預測蛋白質結構。因此,如果這是真的,那么在未來幾年里,我們將有更多的蛋白質結構發揮作用,比我們到目前為止所擁有的要多得多。這是動態第一。

    動態二號是通過我們在 Clara 發現中的工作,以及其他行業的工作,我們正在建立生成化合物的能力。想象一下,使用與 StyleGANGaugan 沒有太大區別的深度學習,可以生成看似無限多的生成圖像。事實證明,你也可以生成各種化合物。我們有一個帶有圖形用戶界面的軟件,在這里你可以點擊并顯示化合物。這意味著在未來幾年,隨著這種能力的成熟,我們將擁有比以前多 100 萬個化合物。在我們有 10 億之前,再過幾年,我們將有 100 億種化合物需要處理。這仍然是表面現象,因為宇宙中潛在化合物的數量可能是 10 到 60 。 這是第二個動態數字。

    因此,行業內的第一個動態正在發生,NVIDIA 正在促成這一動態。對于動態二號,我們正在為此打造一款產品。我們有 Clara 發現,我們有一個特定的工作流程和一種叫做 MegaMolBART 的技術。

    MegaMolBART 采用了 Megatron ,它最初是為大規模自然語言處理( NLP )而開發的,我們將 Megatron 重新用于化學語言,因為有一種方法可以使用字符串格式表示分子。因此,你可以重新利用所有這些 NLP 技術,而將 Megatron 推向市場的技術正是為我們藥物發現工作的這一部分提供動力的技術。這是同一個名為 NeMoMegatron 的軟件。

    ?
    圖 3 。用 Clara 發現的 MegaMolBart 加速藥物發現

    第三個動態數字是,如果你比以前多了一百萬個化合物,你比以前多了幾十個蛋白質結構,那么你想要模擬的組合比以前多了數百萬個。

    現在,模擬,正如我們在計算上所知道的,可能是一個非常密集的問題。事實上, CUDA 的早期使用案例之一是在這種模擬中的分子動力學和科學計算中。但問題是,你如何,如何讓更多的人參與其中?我們正在組建一個團隊來研究這種模擬能力,我們正在聘請分子動力學、力場開發、高性能計算和深度學習應用程序方面的專家來模擬。我們還聘請了化學信息學專家、深度學習研究人員和工程師,以推進我們利用人工智能生成化合物和與蛋白質相互作用的技術。

    我想這就是我們在這里所做的。這是一個獨特的群體,因為我們推出產品,也有產品驅動研究的空間。我們與整個公司的工程團隊廣泛合作,利用能夠推進這些產品的技術,并與各種研究團隊合作,利用整個公司的人工智能突破。

    你能詳述一下你剛才說的嗎?你說它與NVIDIA 的其他研究領域有什么不同?

    我想說的是,就我們正在進行的研究而言,大多數研究實驗室比我們有更多的靈活性。我們的組織在工程和研究之間保持健康的平衡,這樣我們既可以運送產品,又有足夠的帶寬來追求創新機會。但這確實意味著我們的研究目標或研究議程可能在某種程度上受到產品目標的限制,而典型的研究實驗室可能不會受到限制。在一個典型的學術實驗室,甚至是一個行業研究小組,我希望有更多的靈活性,但這是一個權衡。這是靈活性和交付軟件產品所需的高度關注之間的權衡。

    這就是我要問的。那么,研究人員想要加入你們的團隊有什么價值呢?

    問得好。我想說的是,我們傾向于吸引那些對創新研究感興趣并熱衷于確保其研究具有商業影響力的研究人員。對于這些人來說,這種權衡是有意義的。他們愿意根據需要限制和集中研究,以產生他們想要的那種商業影響。

    所以他們的研究更側重于改善 Clara 發現和 Clara 巨摩爾巴特?

    沒錯。因此,我們需要使研究活動與產品目標保持一致。

    你提到,你的大部分工作都涉及工程師,你認為這些工程師在生物技術方面需要有多淵博的知識?

    一個很好的問題。我發現很多有工程背景的人在工作中都學到了這一點。更重要的不是行業知識,而是真正的興趣。我們這里有很多工程師的例子,他們可能在大學里學習過一些這方面的知識,或者他們只是讀了一些這方面的知識,他們有正確的工程背景。

    你知道,在一年或兩年的時間里,他們非常了解自己的行業,因為他們與我們的合作伙伴和合作伙伴合作。所以我想說興趣是最重要的。

    我記得你一開始提到,任何對人工智能、模擬和藥物發現交叉感興趣的人都會覺得這項工作很有趣。

    確切地這是一項激動人心且極具挑戰性的工作,我們只是觸及表面。我期待著未來幾年,隨著我們對NVIDIA Clara 及其為生物技術界做出貢獻的潛力的深入了解,將會帶來什么。

    額外資源

    如果您有興趣了解更多關于 NVIDIA 基因組學的信息,請查看我們的 Genomics 頁面。

    要了解 NVIDIA 正在進行的新研究,請訪問 NVIDIA Research

    ?

    0

    標簽

    人人超碰97caoporen国产