国产制服丝袜在线播放,亚洲人妻网,中文字幕亚洲有码

中紅外光譜與深度學習在消費后塑料穩(wěn)健分類中的應用：一個針對特定領(lǐng)域的框架

《Resources, Conservation and Recycling》：Mid-infrared spectroscopy and deep learning for robust classification of post-consumer plastics: A domain-tailored framework

【字體：大中小】 時間：2026年03月02日 來源：Resources, Conservation and Recycling 11.8

編輯推薦：

　　本研究提出五階段框架解決回收塑料分類難題，通過優(yōu)化數(shù)據(jù)預處理（SG+SNV+SNV），設計輕量級374k參數(shù)CNN模型，結(jié)合可解釋AI和外部驗證，在32萬+真實光譜數(shù)據(jù)上實現(xiàn)99.71%清潔數(shù)據(jù)分類精度和98.50%含污染物分類精度，尤其突破黑色塑料檢測瓶頸。

Bassam A. Abdelghani|Umema Ali|Ezra Bar-Ziv|Fei Long

密歇根理工大學機械與航空航天工程系，美國密歇根州霍頓市49931

摘要

對消費后塑料（尤其是黑色聚合物）進行準確分類仍然是自動化回收領(lǐng)域的一個挑戰(zhàn)。中紅外（MIR）光譜技術(shù)能夠提供化學信息豐富的信號，從而克服了近紅外傳感的局限性，但其應用受到噪聲、基線漂移和污染等因素的阻礙。本文提出了一個五階段框架，包括數(shù)據(jù)集質(zhì)量評估、預處理優(yōu)化、定制的一維卷積神經(jīng)網(wǎng)絡（CNN）、可解釋人工智能（AI）和外部驗證。利用超過320,000個來自八種聚合物類別的光譜數(shù)據(jù)，我們引入了一種十項指標的數(shù)據(jù)集質(zhì)量評估協(xié)議，并對24種預處理流程進行了基準測試。采用Savitzky–Golay平滑處理結(jié)合標準正態(tài)變量歸一化（SG+SNV），并與一個包含374,000個參數(shù)的緊湊型CNN相結(jié)合，在清潔數(shù)據(jù)上的準確率為99.71%，在消費后塑料上的準確率為98.50%。

引言

準確識別混合塑料廢料流對于支持循環(huán)經(jīng)濟模式的有效下游分類和回收至關(guān)重要。聚乙烯（PE）、聚對苯二甲酸乙二醇酯（PET）、聚丙烯（PP）等塑料通常具有相似的外觀和重疊的特性，這使得精確識別變得困難。特征描述不足可能導致誤分類和不當分類，進而引發(fā)污染、增加處理成本以及降低回收材料的質(zhì)量（Neo等人，2022年；Vogt等人，2021年）。這一挑戰(zhàn)對于黑色塑料尤為突出，因為黑色塑料占總塑料廢物的大約15%（Hahladakis等人，2018年；Turner，2018年），然而使用傳統(tǒng)的近紅外（NIR）方法，其分類和分選的準確率僅能達到60%–70%（Zhang等人，2022年；Zinchik等人，2021年）。這是因為炭黑添加劑在可見光和近紅外波長范圍內(nèi)具有強烈的吸收特性，掩蓋了聚合物特有的信號（Tanzid等人，2018年）。

相比之下，中紅外（MIR）光譜技術(shù)通過捕捉2–5 μm范圍內(nèi)的分子振動來實現(xiàn)非破壞性的材料識別，在這個范圍內(nèi)炭黑的吸收不會造成干擾（Rozenstein等人，2017年）。MIR光譜提供了獨特且化學信息豐富的吸收峰，特別適用于區(qū)分具有相似視覺或物理特性的聚合物。與無法檢測黑色塑料的NIR光譜不同，MIR光譜能夠有效識別含色素的塑料（Neo等人，2022年；Long等人，2022年）。Rozenstein等人（2017年）證明了MIR技術(shù)在準確分類消費后黑色塑料方面的能力，凸顯了其解決傳統(tǒng)基于NIR的分選方法固有局限性的潛力。

盡管MIR光譜技術(shù)具有諸多優(yōu)勢，但由于數(shù)據(jù)收集速度的限制，其在工業(yè)中的應用仍較為有限。最近的進展，如上轉(zhuǎn)換探測器、量子級聯(lián)激光器及相關(guān)硬件，開始緩解這些限制；然而，實際參數(shù)（如曝光時間）如何平衡信號質(zhì)量、探測器線性和線速吞吐量等方面仍需進一步研究（Rozenstein等人，2017年；Long等人，2022年）。

此外，可靠的光譜分類機器學習（ML）模型不僅需要強大的算法，還需要高質(zhì)量的教學數(shù)據(jù)集。標準化的數(shù)據(jù)集質(zhì)量評估方法仍然很少；大多數(shù)先前的研究僅依賴于信噪比（SNR）等基本指標，忽略了類別可分性、峰值一致性或重復實驗間的變異性等關(guān)鍵指標（Neo等人，2022年）。這種差距往往導致數(shù)據(jù)集選擇的隨意性，從而影響可重復性和魯棒性。此外，MIR光譜數(shù)據(jù)本身存在系統(tǒng)噪聲和偽影，包括基線漂移、表面粗糙度引起的散射以及隨機噪聲。雖然有多種預處理方法可用，但其最佳組合高度依賴于數(shù)據(jù)本身，且手動調(diào)整通常具有主觀性和勞動密集性。

深度學習，特別是卷積神經(jīng)網(wǎng)絡（CNN），通過自動提取有意義的特征，徹底改變了光譜分類任務。這些方法顯著優(yōu)于傳統(tǒng)的ML方法，如支持向量機（SVM）、k最近鄰（kNN）和偏最小二乘判別分析（PLS-DA）（Naidu等人，2023年；Neo等人，2022年）。最近的研究在MIR光譜應用中驗證了基于CNN的模型的有效性，展示了在混合塑料廢料分類方面的出色準確率（Zinchik等人，2021年；Long等人，2022年）。然而，僅憑準確率不足以滿足實際應用需求；還需要評估宏觀F1分數(shù)、接收者操作特征曲線下面積（AUROC）、預期校準誤差（ECE）和Brier分數(shù)等綜合指標來量化模型的可靠性。

此外，可解釋性仍是基于CNN的方法的主要限制。傳統(tǒng)的化學計量模型允許通過系數(shù)向量直接檢查特征的重要性，而CNN通常被視為“黑箱”。最近在可解釋AI（XAI）方面的進展，包括Shapley加性解釋（SHAP）、局部可解釋模型不可知解釋（LIME）、集成梯度和遮擋敏感性，現(xiàn)在能夠?qū)NN預測進行有意義的解釋（Contreras等人，2024年），但跨預處理流程的系統(tǒng)比較研究仍然較少。

文獻中的一個持續(xù)存在的問題是缺乏嚴格的外部驗證。大多數(shù)現(xiàn)有模型僅在清潔的、實驗室獲得的數(shù)據(jù)上進行訓練和評估，當面對含有油、粘合劑或環(huán)境降解的實際樣品時，它們的表現(xiàn)往往不佳（Naidu等人，2023年）。確保模型的泛化能力需要使用在真實操作條件下收集的獨立測試集進行評估。

我們團隊之前的研究探索了多種基于MIR的塑料特征描述方法，強調(diào)了處理含噪聲、受污染的實際樣品的潛在性和持續(xù)挑戰(zhàn)（Jiang等人，2021年；Long等人，2022年；Zinchik等人，2021年；Long等人，2022年；Long等人，2025年）。

基于這些基礎，本文通過幾個關(guān)鍵進展解決了現(xiàn)有的研究空白：

（1）
構(gòu)建了一個大規(guī)模的中紅外光譜數(shù)據(jù)集，包含超過320,000個光譜（每種暴露條件80,000個），涵蓋了八種聚合物類別，并結(jié)合了一個十項指標的質(zhì)量評估框架，系統(tǒng)地評估了光譜的完整性、統(tǒng)計可分性和實際可用性。
（2）
通過廣泛的網(wǎng)格搜索對24種配置進行嚴格的預處理優(yōu)化，統(tǒng)計上驗證了該方法能夠提高光譜清晰度和模型性能。
（3）
多指標機器學習模型評估，包括宏觀F1分數(shù)、精確度、召回率、校準評估和穩(wěn)健的5折交叉驗證，以進行全面性能驗證。
（4）
基于共識的可解釋性方法，使用五種互補的XAI方法來可靠地識別驅(qū)動預測的化學上有意義的光譜特征。
（5）
嚴格的外部驗證，在真實的消費后回收塑料上展示了高準確率（98.50%）。

為了進一步區(qū)分本研究與傳統(tǒng)MIR分類流程，我們提出了一個針對特定領(lǐng)域的框架，該框架明確利用了聚合物特有的吸收化學特性和工業(yè)應用的限制。具體而言，該框架整合了考慮吸收帶的預處理和模型設計，建立了一個適用于污染和混合進料變異性的可重復數(shù)據(jù)集質(zhì)量評估協(xié)議，應用多方法可解釋AI來驗證化學相關(guān)性，并在地理上不同的樣本上對外部性能進行了驗證。與通用卷積分類器不同，所提出的框架是光譜指導的，并針對實際回收設施中的色素添加劑、表面污染和吞吐量要求進行了優(yōu)化。

本文的其余部分組織如下：第2節(jié)詳細介紹了我們的方法論。第3節(jié)展示了實驗結(jié)果以及來自XAI分析的化學上有意義的見解。第4節(jié)總結(jié)了實際意義、局限性以及對未來研究的建議。

方法論

我們的方法論遵循一個五階段的工作流程（圖1a），旨在從MIR光譜開發(fā)并驗證一個穩(wěn)健的塑料分類系統(tǒng)。從數(shù)據(jù)集質(zhì)量篩選開始，我們系統(tǒng)地推進到預處理優(yōu)化、模型開發(fā)、可解釋性分析和外部驗證。每個階段都建立在前一階段的基礎上，形成了一個能夠在實際消費后塑料廢料上可靠運行的綜合框架。

數(shù)據(jù)集質(zhì)量比較

每個暴露設置都使用了十項指標的質(zhì)量評估框架進行評估（圖3(A)：綜合質(zhì)量指標；圖3(B)：平均光譜）。

如圖3(A)所示，Dataset_10ms在關(guān)鍵指標上取得了最高的綜合得分（17.32），表現(xiàn)優(yōu)異：幾乎完美的分類準確率（99.70%）、強Fisher判別度（3.96）、穩(wěn)定的聚類分離指數(shù)（0.357）、平衡的類熵（2.08）和最小的水干擾（242）。

結(jié)論

一個精心設計的MIR光譜流程——從十項指標的數(shù)據(jù)質(zhì)量審計開始，經(jīng)過統(tǒng)計排序的預處理，最終使用校準的一維CNN——實現(xiàn)了高達99%的聚合物分類準確率。在評估的四種暴露設置中，10 ms產(chǎn)生了最高的綜合質(zhì)量得分（17.32），而Savitzky–Golay + SNV配置結(jié)合一階基線校正（Config-1）對于傳統(tǒng)方法和深度學習方法都是最優(yōu)的。

CRediT作者貢獻聲明

Bassam A. Abdelghani：撰寫——原始草稿、可視化、驗證、方法論、調(diào)查、正式分析。Umema Ali：數(shù)據(jù)管理。Ezra Bar-Ziv：撰寫——原始草稿、監(jiān)督、項目管理、調(diào)查。Fei Long：撰寫——原始草稿、驗證、監(jiān)督、項目管理、調(diào)查、資金獲取、正式分析、數(shù)據(jù)管理。

利益沖突聲明

作者聲明以下可能的財務利益/個人關(guān)系可能被視為潛在的利益沖突：Fei Long報告稱獲得了國家科學基金會的財務支持。如果還有其他作者，他們聲明沒有已知的財務利益或個人關(guān)系可能影響本文所述的工作。

致謝

本工作得到了國家科學基金會（PFI-RP 2234450）的支持。

相關(guān)新聞

生物通微信公眾號

微信

新浪微博

我要投稿

搜索
國際
國內(nèi)
人物
產(chǎn)業(yè)
熱點
科普

熱搜：中紅外光譜|塑料分類|卷積神經(jīng)網(wǎng)絡|數(shù)據(jù)預處理優(yōu)化|可解釋人工智能

知名企業(yè)招聘

摘要

引言

方法論

數(shù)據(jù)集質(zhì)量比較

結(jié)論

CRediT作者貢獻聲明

利益沖突聲明

致謝

熱點排行

新聞專題