近年來,數據科學工具,尤其是機器學習(ML),在材料科學領域取得了重要進展,包括材料發現[1]、[2]、性能優化/預測[3]、計算機模擬的原子間勢能開發[3]、[4]以及微觀結構分析[5]、[6]、[7]、[8]、[9]等方面。具體來說,利用機器學習獲取和解釋材料微觀結構的能力,使我們在介觀尺度上定量表征和分析材料結構和動態方面取得了突破性進展。例如,通過透射電子顯微鏡(TEM)獲得的薄膜金屬微觀結構的分割,過去是一項需要人工干預來追蹤晶界的艱巨任務,現在可以通過基于卷積神經網絡(CNN)的算法邊界檢測方法(如U-Net [10])輕松完成,從而大大減少了繁瑣的手動追蹤工作[11]。此外,機器學習工具還實現了亮場TEM圖像中離散缺陷[12]、掃描隧道顯微鏡(STM)圖像中的點缺陷[13]以及高分辨率掃描透射電子顯微鏡(STEM)圖像中的鐵磁疇[14]的自動檢測和識別。此外,機器學習工具為微觀結構分析和建模開辟了許多有價值的途徑,包括:結構分類、基于微觀結構的合金設計、學習到的結構-性能關系、稀有晶粒尺寸分布事件的識別、數據驅動的介觀尺度模擬等。
最近在微觀結構圖像獲取和解釋中應用的機器學習方法值得特別關注。如上所述,新的方法徹底改變了圖像分割的任務,每種方法都有其相對的優勢和劣勢。例如,YOLO [15] 是一種快速處理圖像的單階段架構,通常以犧牲準確性和精度為代價;而Mask R-CNN [16] 則是一種兩階段框架,用于圖像中的對象檢測,并同時生成分割掩碼。此外,基于YOLO的模型對對象大小非常敏感,因此存在一些基于多尺度架構(如U-Net)的模型所沒有的挑戰,盡管前者模型特別適用于顯微鏡下的實時分割[17]。在YOLO和基于Mask的模型中,都需要監督學習的數據,但最近在零樣本、少樣本[18]和基礎模型(如Segment Anything Model (SAM))方面的進展為微觀結構評估提供了強大的工具,盡管仍存在顯著限制。因此,在材料科學應用中選擇特定方法取決于具體情境(例如領域)、可用的或所需的數據以及所使用的顯微鏡技術。
對于已分割的微觀結構,提取表征系統的物理特征(如相分數、顆粒形態等)是很重要的,然后使用這些特征向量進行后續分類。傳統上,人們采用數字圖像分析技術(如邊緣檢測和紋理分析(例如灰度共生矩陣(GLCM)[19])來進行特征分析,F在,這一過程通過計算機視覺算法[20]得到簡化,在高維特征空間的情況下,結果通過降維策略(如主成分分析(PCA)[21]映射到低維空間。然后,特征向量成為分類器(如隨機森林或支持向量機(SVM)[22])的輸入,從而實現對微觀結構特征的解釋。
微觀結構解釋和建模也受益于材料信息學工具箱中一系列技術的應用。在這一領域,既使用了監督學習方法,也使用了無監督學習方法來進行數據解釋。在前者中,傳統的ML方法(如基于將類別標簽與預測特征關聯的模型的方法)被用來描述圖像內容(如局部相身份),或區分圖像像素以進行后續分割[23]、[24]。在后者中,人們通常希望根據相似的共享特征將數據分組到不同的簇中。其中,無監督k-means聚類[25]尤為突出,例如用于顆粒的聚類分析[5]、識別鋁中晶界附近的應變局部化區域[26]以及模擬沉淀動力學[27]。
為了解釋靜態和動態的分割微觀結構,人們還使用了相關統計技術[28],這些技術來自諸如點相關函數[29]、[30]等描述符。這些統計描述符體現了不同微觀結構區域之間的平均空間和/或時間關聯,并系統地描述了序參量(如局部相或晶體取向)的潛在概率分布。值得注意的是,這些相關量是對復雜性度量的補充,而這些復雜性度量是基于信息論[31]、[32]和譜圖理論[33]定義的微觀結構熵的代理。熵的時間演化有助于區分各種粗化現象,例如異常晶粒生長[32]、[34]。
鑒于機器學習在材料微觀結構獲取和解釋中日益重要的作用以及快速的發展步伐,提供關于材料信息學在材料科學和工程及相關領域復雜微觀結構問題中的應用影響、許多成功案例和剩余挑戰的當前概述是非常有用且及時的。在本概述中,我們綜述了推動上述進展的重要ML方法和應用,并為解決缺陷檢測、原位晶粒尺寸統計數據的獲取、演變微觀結構的建模以及大型微觀結構數據集的分析和管理等當前和未來的挑戰提供了路線圖?傮w目標不是提供詳盡的操作手冊或方法論的全面描述,而是提供一個快速發展的領域的詳細快照,其中包含縮寫和術語,以澄清概念、突出重要問題和考慮因素,并強調最佳實踐。
本概述的結構如下:第2節總結了不同的圖像分割和特征提取方法,重點介紹了機器學習在這些任務中的作用。第3節概述了各種顯微鏡技術,并描述了與圖像分割和圖像對象識別相關的問題。為了清晰起見,還包含了每個顯微鏡技術的關鍵信息摘要表。第4節探討了機器學習在微觀結構分析和建模中的作用,概述了利用神經網絡(NN)進行分類和聚類等圖像解釋策略。我們還回顧了用于調整微觀結構以實現極端理想性能的微觀結構優化和逆向設計方法,以及用于表征異常晶粒生長(AGG)的相關統計和基于NN的技術。第5節討論了與數據管理相關的問題,包括在整個生命周期中維護和研究數據的保存。第6節對該領域的未來發展進行了討論和展望。最后,提供了術語表、重要的基于ML的分割方法總結和縮寫列表,以指導讀者。