麻省理工學院(MIT)的新研究表明,大型語言模型(LLMs)正逐漸成為保護可再生能源、醫療健康或交通等關鍵基礎設施系統的工具。?
該研究引入了零沖擊 LLM 模型,用于檢測復雜數據中的異常情況。使用 AI 驅動的診斷來監控和標記設備(如風力渦輪機、MRI 機器和鐵路)中的潛在問題,該方法可以降低運營成本、提高可靠性、減少機時間,并支持可持續的行業運營。
根據研究報告的資深作者 Kalyan Veeramachaneni 稱,使用深度學習模型檢測基礎設施問題需要花費大量時間和資源來進行訓練、微調和測試。部署機器學習模型需要機器學習團隊與監控設備的運營團隊之間的密切合作,該團隊負責訓練模型。
隨著真實數據的傳入,團隊必須持續協調,以應對任何出現的挑戰。如果發生更改(例如添加新的數據信號或更新設備),他們通常需要重啟整個部署流程。
Veeramachaneni 說:“與此相比,LLM 即插即用,我們不必為每個新的數據流創建獨立的模型,我們可以直接在數據流上部署 LLM。”
研究人員創建了 SigLLM,這是一種將時間序列數據轉換為文本以供分析的框架。然后,GPT-3.5 Turbo 和 Mistral LLM 用于檢測模式不規則,并標記可能表明系統中潛在操作問題的異常情況。
該團隊使用 11 個不同的數據集(492 個一元時間序列和 2,349 個異常情況)評估了 SigLLM 的性能。各種數據來自廣泛的應用,包括 NASA 的衛星和 Yahoo 的流量,信號長度和異常情況各不相同。
兩個 NVIDIA Titan RTX GPU 和一個 NVIDIA V100 Tensor Core GPU 可以處理運行 GPT-3.5 Turbo 和 Mistral 以實現零樣本異常檢測的計算需求。

該研究發現,LLMs 可以檢測異常情況,與傳統的檢測方法不同,SigLLM 在模式識別中使用 LLMs 的固有能力,而無需進行大量訓練。然而,專業的深度學習模型的性能比 SigLLM 高出約 30%
“我們驚訝地發現,基于 LLM 的方法的表現優于一些基于深度學習 Transformer 的方法,”Veeramachaneni 說,“不過,這些方法還不如當前的先進模型好,例如?Autoencoder with Regression(AER)。為了達到這一水平,我們還有一些工作要做。”?
這項研究可以為 AI 驅動的監控邁出重要一步,具有高效異常檢測的潛力,特別是在模型進一步增強的情況下。
Veeramachaneni 表示,主要的挑戰是確定該方法的可靠性,同時保持 LLMs 提供的優勢。該團隊還計劃研究 LLMs 如何在不進行微調的情況下有效預測異常情況,這將涉及使用各種提示測試 LLMs。
研究中使用的數據集可在?GitHub?上公開獲取。
在 MIT News 上閱讀完整故事《閱讀研究大型語言模型可以成為時間序列的零樣本異常檢測器?》?AI for Good 博客系列展示了 AI 在解決緊迫的全球挑戰方面的變革力量。了解研究人員和開發者如何利用突破性技術,并利用 AI 啟動創新項目,為人類和地球帶來積極的變化。
?