準確識別混合塑料廢料流對于支持循環(huán)經(jīng)濟模式的有效下游分類和回收至關(guān)重要。聚乙烯(PE)、聚對苯二甲酸乙二醇酯(PET)、聚丙烯(PP)等塑料通常具有相似的外觀和重疊的特性,這使得精確識別變得困難。特征描述不足可能導致誤分類和不當分類,進而引發(fā)污染、增加處理成本以及降低回收材料的質(zhì)量(Neo等人,2022年;Vogt等人,2021年)。這一挑戰(zhàn)對于黑色塑料尤為突出,因為黑色塑料占總塑料廢物的大約15%(Hahladakis等人,2018年;Turner,2018年),然而使用傳統(tǒng)的近紅外(NIR)方法,其分類和分選的準確率僅能達到60%–70%(Zhang等人,2022年;Zinchik等人,2021年)。這是因為炭黑添加劑在可見光和近紅外波長范圍內(nèi)具有強烈的吸收特性,掩蓋了聚合物特有的信號(Tanzid等人,2018年)。
相比之下,中紅外(MIR)光譜技術(shù)通過捕捉2–5 μm范圍內(nèi)的分子振動來實現(xiàn)非破壞性的材料識別,在這個范圍內(nèi)炭黑的吸收不會造成干擾(Rozenstein等人,2017年)。MIR光譜提供了獨特且化學信息豐富的吸收峰,特別適用于區(qū)分具有相似視覺或物理特性的聚合物。與無法檢測黑色塑料的NIR光譜不同,MIR光譜能夠有效識別含色素的塑料(Neo等人,2022年;Long等人,2022年)。Rozenstein等人(2017年)證明了MIR技術(shù)在準確分類消費后黑色塑料方面的能力,凸顯了其解決傳統(tǒng)基于NIR的分選方法固有局限性的潛力。
盡管MIR光譜技術(shù)具有諸多優(yōu)勢,但由于數(shù)據(jù)收集速度的限制,其在工業(yè)中的應用仍較為有限。最近的進展,如上轉(zhuǎn)換探測器、量子級聯(lián)激光器及相關(guān)硬件,開始緩解這些限制;然而,實際參數(shù)(如曝光時間)如何平衡信號質(zhì)量、探測器線性和線速吞吐量等方面仍需進一步研究(Rozenstein等人,2017年;Long等人,2022年)。
此外,可靠的光譜分類機器學習(ML)模型不僅需要強大的算法,還需要高質(zhì)量的教學數(shù)據(jù)集。標準化的數(shù)據(jù)集質(zhì)量評估方法仍然很少;大多數(shù)先前的研究僅依賴于信噪比(SNR)等基本指標,忽略了類別可分性、峰值一致性或重復實驗間的變異性等關(guān)鍵指標(Neo等人,2022年)。這種差距往往導致數(shù)據(jù)集選擇的隨意性,從而影響可重復性和魯棒性。此外,MIR光譜數(shù)據(jù)本身存在系統(tǒng)噪聲和偽影,包括基線漂移、表面粗糙度引起的散射以及隨機噪聲。雖然有多種預處理方法可用,但其最佳組合高度依賴于數(shù)據(jù)本身,且手動調(diào)整通常具有主觀性和勞動密集性。
深度學習,特別是卷積神經(jīng)網(wǎng)絡(CNN),通過自動提取有意義的特征,徹底改變了光譜分類任務。這些方法顯著優(yōu)于傳統(tǒng)的ML方法,如支持向量機(SVM)、k最近鄰(kNN)和偏最小二乘判別分析(PLS-DA)(Naidu等人,2023年;Neo等人,2022年)。最近的研究在MIR光譜應用中驗證了基于CNN的模型的有效性,展示了在混合塑料廢料分類方面的出色準確率(Zinchik等人,2021年;Long等人,2022年)。然而,僅憑準確率不足以滿足實際應用需求;還需要評估宏觀F1分數(shù)、接收者操作特征曲線下面積(AUROC)、預期校準誤差(ECE)和Brier分數(shù)等綜合指標來量化模型的可靠性。
此外,可解釋性仍是基于CNN的方法的主要限制。傳統(tǒng)的化學計量模型允許通過系數(shù)向量直接檢查特征的重要性,而CNN通常被視為“黑箱”。最近在可解釋AI(XAI)方面的進展,包括Shapley加性解釋(SHAP)、局部可解釋模型不可知解釋(LIME)、集成梯度和遮擋敏感性,現(xiàn)在能夠?qū)NN預測進行有意義的解釋(Contreras等人,2024年),但跨預處理流程的系統(tǒng)比較研究仍然較少。
文獻中的一個持續(xù)存在的問題是缺乏嚴格的外部驗證。大多數(shù)現(xiàn)有模型僅在清潔的、實驗室獲得的數(shù)據(jù)上進行訓練和評估,當面對含有油、粘合劑或環(huán)境降解的實際樣品時,它們的表現(xiàn)往往不佳(Naidu等人,2023年)。確保模型的泛化能力需要使用在真實操作條件下收集的獨立測試集進行評估。
我們團隊之前的研究探索了多種基于MIR的塑料特征描述方法,強調(diào)了處理含噪聲、受污染的實際樣品的潛在性和持續(xù)挑戰(zhàn)(Jiang等人,2021年;Long等人,2022年;Zinchik等人,2021年;Long等人,2022年;Long等人,2025年)。
基于這些基礎,本文通過幾個關(guān)鍵進展解決了現(xiàn)有的研究空白:
- (1)
構(gòu)建了一個大規(guī)模的中紅外光譜數(shù)據(jù)集,包含超過320,000個光譜(每種暴露條件80,000個),涵蓋了八種聚合物類別,并結(jié)合了一個十項指標的質(zhì)量評估框架,系統(tǒng)地評估了光譜的完整性、統(tǒng)計可分性和實際可用性。
- (2)
通過廣泛的網(wǎng)格搜索對24種配置進行嚴格的預處理優(yōu)化,統(tǒng)計上驗證了該方法能夠提高光譜清晰度和模型性能。
- (3)
多指標機器學習模型評估,包括宏觀F1分數(shù)、精確度、召回率、校準評估和穩(wěn)健的5折交叉驗證,以進行全面性能驗證。
- (4)
基于共識的可解釋性方法,使用五種互補的XAI方法來可靠地識別驅(qū)動預測的化學上有意義的光譜特征。
- (5)
嚴格的外部驗證,在真實的消費后回收塑料上展示了高準確率(98.50%)。
為了進一步區(qū)分本研究與傳統(tǒng)MIR分類流程,我們提出了一個針對特定領(lǐng)域的框架,該框架明確利用了聚合物特有的吸收化學特性和工業(yè)應用的限制。具體而言,該框架整合了考慮吸收帶的預處理和模型設計,建立了一個適用于污染和混合進料變異性的可重復數(shù)據(jù)集質(zhì)量評估協(xié)議,應用多方法可解釋AI來驗證化學相關(guān)性,并在地理上不同的樣本上對外部性能進行了驗證。與通用卷積分類器不同,所提出的框架是光譜指導的,并針對實際回收設施中的色素添加劑、表面污染和吞吐量要求進行了優(yōu)化。
本文的其余部分組織如下:第2節(jié)詳細介紹了我們的方法論。第3節(jié)展示了實驗結(jié)果以及來自XAI分析的化學上有意義的見解。第4節(jié)總結(jié)了實際意義、局限性以及對未來研究的建議。