《Future Foods》:Machine Learning-Based Prediction of Cold-Pressed Oil Storage Time Using NIR and Electronic-Nose Data
編輯推薦:
針對傳統油脂貨架期評估方法破壞性強、參數單一且無法反映脂質氧化復雜性的問題,研究人員開展了結合近紅外光譜(NIR)與電子鼻(e-nose)數據的機器學習研究。該研究成功構建了ANN模型,準確預測了脂肪酸、多酚及揮發性氧化產物的變化,并整合形成多指標指紋,最終利用PLSR和RF模型實現了對冷榨油貯藏時間的非破壞性估測,誤差(MAPE)為23%,為實時質量監控和減少食品浪費提供了創新方案。
冷榨植物油因其富含多不飽和脂肪酸(PUFA)和生物活性物質而備受青睞,但這也使其極易發生氧化變質,產生令人不悅的哈敗味,從而降低產品接受度和市場價值。傳統的貨架期評估主要依賴于過氧化值等破壞性的實驗室單指標分析,這些方法耗時費力,且難以全面反映油脂在儲藏過程中復雜的、多因素共同作用的劣變本質。因此,開發快速、非破壞性的技術來動態監控油脂品質、預測其剩余貨架期,對于生產商控制產品質量、零售商管理庫存以及消費者避免食用變質產品、減少食物浪費都具有重要意義。
本研究正是為了應對這一挑戰而開展。研究人員在《Future Foods》上發表論文,提出了一種創新的解決方案:他們巧妙地將兩種快速掃描技術——近紅外光譜(NIR)和電子鼻(e-nose)——與先進的人工智能算法相結合,旨在僅通過非破壞性的測量,就能預測冷榨油的化學劣變程度及其實際儲藏時間。這就像是為油脂裝上了“智能嗅覺”和“智能視覺”,無需打開瓶子進行復雜化驗,就能洞察其內部化學變化的“年齡”。
為了開展這項研究,團隊選取了六種具有不同脂肪酸組成的冷榨油(黑孜然、向日葵、高油酸向日葵、菜籽、亞麻籽和大麻籽油),在模擬家庭使用條件下(透明PET瓶,25°C,每日光照)儲藏168天,并在10個時間點取樣。關鍵的技術方法主要包括:1)使用手持式近紅外光譜儀和包含九個金屬氧化物半導體傳感器的定制電子鼻,對所有油樣進行非破壞性測量,獲取光譜和氣味指紋數據;2)運用氣相色譜、液相色譜-串聯質譜等傳統分析技術,精確測定每份樣品的五種脂肪酸、48種多酚和18種次級脂質氧化產物的含量,構建高質量的化學“真相”數據集;3)采用人工神經網絡(ANN)等多種機器學習算法,建立從傳感器數據預測化學成分的模型,并將預測出的多指標化學指紋進一步輸入到偏最小二乘回歸(PLSR)、主成分回歸(PCR)和隨機森林(RF)等模型中,最終預測油脂的儲藏時間。
近紅外光譜評估儲藏過程
通過分析儲藏過程中的近紅外光譜變化,研究發現光譜能靈敏地捕捉油脂的氧化信息。在1699–1776 nm區域(與不飽和脂肪酸C-H伸縮的一級倍頻相關)的吸光度下降,反映了PUFA的消耗;而在2269–2396 nm區域(與脂酰鏈的C-H伸縮/變形組合帶相關)的吸光度降低,則與油脂次級氧化導致的鏈斷裂和結構變化有關。例如,黑孜然油在1595–1630 nm區域的吸光度獨特上升,可能與其富含的芳香族酚類物質(如百里醌)的氧化轉化有關。這些結果表明,近紅外光譜能夠區分不同油脂的氧化階段和特異性降解模式。
電子鼻評估
電子鼻的傳感器響應同樣顯示出清晰的隨時間變化的模式。對醛類和酮類敏感的傳感器(如MQ138)以及廣譜傳感器(MQ135)響應最為強烈,這與油脂氧化過程中產生的己醛、戊醛等關鍵揮發性物質的積累相符。富含PUFA的油脂(如大麻籽油、亞麻籽油)傳感器信號下降最陡峭,表明其氧化速率最快、揮發性產物生成最多。相關性分析進一步證實,電子鼻信號與氣相色譜-質譜測定的多種次級氧化產物(如己醛、(E)-2-壬烯醛)含量顯著相關,驗證了其用于監測氧化過程的化學可靠性。
機器學習建模
在分類任務中,基于近紅外光譜的人工神經網絡模型能夠以96.2%的整體準確率區分六種油類,而基于電子鼻的模型準確率為77.6%。在更困難的按生產商分類任務中,兩者準確率均較低,表明傳感器技術更擅長捕捉油類本身的化學差異而非細微的產地差異。
在回歸預測任務中,模型表現出色。使用貝葉斯正則化算法的ANN模型,能夠基于近紅外光譜準確預測五種主要脂肪酸的含量,測試集相關系數R達到0.95。使用Levenberg–Marquardt算法的模型,對48種多酚的預測取得了R=0.97的高精度。基于電子鼻數據預測18種次級脂質氧化產物的模型,測試集R為0.82。這些模型在未參與訓練的第77、147和213天的“部署”樣本上也表現穩健,驗證了其泛化能力。
用于儲藏時間預測的多指標分析
這是本研究的核心創新。研究人員將上述ANN模型預測出的所有化學指標(共71個特征)整合起來,構建了多指標回歸模型來預測儲藏時間。在偏最小二乘回歸、主成分回歸和隨機森林三種模型中,偏最小二乘回歸展現了最佳的線性預測能力(R=0.87),而隨機森林取得了最低的預測誤差(平均絕對百分比誤差MAPE為23.3%)。重要的是,這些模型能夠正確地對未見過樣品的儲藏時間進行排序(77天 < 147天 < 213天),證明基于傳感器預測的化學指紋能夠有效反映油脂氧化的“時間軌跡”。
研究結論與討論部分強調,這項工作首次證明,結合近紅外和電子鼻的非破壞性快速掃描技術與機器學習,能夠準確預測家庭儲藏條件下多種冷榨油的化學劣變和儲藏時間。通過構建“傳感器數據 → 化學成分預測 → 多指標指紋整合 → 儲藏時間估測”的框架,該研究實現了從分子層面理解氧化過程到實際應用場景預測的跨越。與以往專注于單一質量參數或分類的研究不同,本研究提出的多指標框架能夠非破壞性地重建油脂的儲藏歷史,為實時質量監控、早期變質預警以及減少與氧化哈敗相關的食物浪費提供了強有力的工具。盡管未來需要在更多油種、包裝條件和環境變量下進行驗證,但該研究為冷榨油行業乃至整個食品工業邁向數據驅動的、可持續的質量控制新范式奠定了堅實的基礎。