將新技術應用于研究古代歷史,研究人員希望通過一種新的人工智能算法擴大對恐龍的了解。這項研究發表在 地球科學前沿 上,使用高分辨率計算機斷層掃描( CT )成像結合深度學習模型來掃描和評估恐龍化石。這項研究是朝著創造一種新工具邁出的一步,這種工具將極大地改變古生物學家研究古代遺跡的方式。
“計算機斷層掃描以及其他成像技術已經揭示了化石中以前隱藏的結構,但高分辨率圖像需要古生物學家花費數周甚至數月的時間進行后期處理,通常是從巖石基質中分割化石。人工智能的引入不僅可以加快化石研究中的數據處理,而且還可以提高化石研究的效率。” ut 還為更客觀、更具重現性的研究建立了基準,”主要作者、美國自然歷史博物館理查德·吉爾德研究生院博士生余聰宇說。
為了全面了解古代脊椎動物,古生物學家關注內部解剖學,如顱骨容量、內耳或血管空間。為此,研究人員使用了一種稱為薄切片的技術。從化石上取下一小塊(薄到幾微米),在顯微鏡下檢查,并注釋他們發現的結構,有助于他們拼湊恐龍的形態。然而,這項技術對遺體具有破壞性,而且非常耗時。
計算機斷層掃描( CT )使科學家能夠在保持化石完好無損的同時觀察樣本內部。這項技術實質上是對一塊化石進行檢查,捕捉到數千張化石的圖像。然后,軟件重建圖像并生成三維圖形,從而生成樣本的內部快照。然后,科學家可以檢查并標記圖形中可識別的形態,以了解更多關于標本的信息。
成像技術為科學家提供了一種工具,可以揭示隱藏的內部結構,并推進恐龍的 3D 模型。研究幫助研究人員估計體重,分析頭骨,甚至了解牙齒形態和牙齒替換模式。
然而,通過這種方法,科學家仍然可以手動選擇片段、檢查和標記圖像,這不僅是時間密集型的,而且是主觀的,并且可能會引入錯誤。此外,掃描在區分可能覆蓋化石的巖石和骨骼本身方面存在局限性,因此很難確定巖石的終點和化石的起點。
人工智能已被證明能夠在醫學領域快速分割圖像,從識別腦損傷到皮膚癌。研究人員發現了一個將類似的深度學習模型應用于 CT 化石圖像的機會。
他們使用深層神經網絡和 10000 多個對三個保存完好的原角龍胚胎頭骨的注釋 CT 掃描來測試這種新方法。這些化石于 20 世紀 90 年代從蒙古戈壁沙漠中發現,它們來自早期有角恐龍,是較知名的三角龍的較小親屬。
該團隊使用一個經典的 U-net 深度神經網絡來處理化石分割,教授從化石中識別巖石的算法。改進后的 DeepLab v3 +網絡用于訓練特征識別、對 CT 圖像的部分進行分類和 3D 渲染。
在 cuDNN 加速 TensorFlow 深度學習框架上,使用 7986 張人工注釋的骨結構 CT 切片對模型進行訓練 NVIDIA GeForce RTX 2080 Ti GPU.
通過對 3329 個數據集的測試結果,他們發現,雖然分割模型達到了約 97% 的高精度,但 3D 特征渲染并不像人類那樣細致或準確。雖然結果表明,特征模型的表現不如科學家們準確,但分割模型工作順利,并在創紀錄的時間內完成。模型在幾秒鐘內分割出每一片,在某些情況下,手動分割同一片需要幾分鐘甚至幾小時。這有助于古生物學家減少將化石與巖石區分開來的時間。


研究人員認為,結合其他恐龍物種和不同沉積物類型的更大數據集有助于創建一個高性能的算法。
??”我們相信,戈壁沙漠化石的分割模型并不遙遠,但一個更通用的模型不僅需要更多的訓練數據集,還需要算法創新,” Yu 在 press release 的一篇文章中說。“我相信深度學習最終能比我們更好地處理圖像,而且已經有很多例子表明深度學習的表現超過人類,包括 Go playing 和 蛋白質三維結構預測 。”
研究中使用的數據集 基于深度學習的恐龍化石 CT 分割 可在此?下載?。
?