食物是維持人類健康的主要能量和必需營養(yǎng)素來源。在精準(zhǔn)營養(yǎng)和膳食優(yōu)化的背景下,準(zhǔn)確量化關(guān)鍵營養(yǎng)成分對于質(zhì)量控制和膳食配方至關(guān)重要[1]。然而,傳統(tǒng)的分析技術(shù)通常涉及破壞性的化學(xué)或生化測定,需要樣品預(yù)處理和消耗,這與“測量的樣品應(yīng)保持為消費(fèi)產(chǎn)品”的原則相矛盾[2]。這一限制凸顯了需要快速、無損的分析技術(shù),以實(shí)現(xiàn)原位成分評估,從而支持智能食品加工和個(gè)性化營養(yǎng)管理[3]。
近紅外光譜(NIRS)因其對分子鍵的倍頻和組合振動(dòng)(如O-H、C-H和N-H)的敏感性,能夠快速且無創(chuàng)地檢測生物材料中的成分特征[4]。當(dāng)與化學(xué)計(jì)量建模結(jié)合時(shí),NIRS已廣泛應(yīng)用于多種食品基質(zhì)的質(zhì)量分析,包括牛奶、谷物、水果和食用油,使其成為現(xiàn)代食品工業(yè)中實(shí)時(shí)質(zhì)量評估和過程優(yōu)化的強(qiáng)大工具[5]、[6]。
NIRS分析通常包括光譜采集、分析建模和結(jié)果輸出[7]。NIRS分析的建模策略一般分為機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法[8]、[9]。由于可解釋性和魯棒性,偏最小二乘(PLS)和支持向量回歸(SVR)等機(jī)器學(xué)習(xí)方法被廣泛使用;然而,它們依賴于手工制作的特征和線性或淺層非線性假設(shè),限制了其表征復(fù)雜光譜-化學(xué)關(guān)系的能力[10]。為了緩解這些限制,引入了包括一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)、長短期記憶網(wǎng)絡(luò)(LSTM)、混合CNN-LSTM架構(gòu)和Spectral-Transformer在內(nèi)的深度學(xué)習(xí)模型,以從原始光譜中學(xué)習(xí)層次化表示[11]、[12]、[13]、[14]。然而,這些架構(gòu)主要基于網(wǎng)格或順序假設(shè),這限制了它們在NIRS數(shù)據(jù)中明確編碼光譜變量之間長距離化學(xué)相關(guān)性的能力[15]。
為了明確建模這些變量之間的關(guān)系,圖神經(jīng)網(wǎng)絡(luò)(GNN)提供了一個(gè)原理性的框架,通過明確的關(guān)系建模和拓?fù)涓兄臍w納偏差來捕捉全局依賴性和復(fù)雜的帶間相互作用,為光譜數(shù)據(jù)分析提供了一種獨(dú)特且結(jié)構(gòu)感知的建模范式。由于這些特性,基于GNN的方法已在多個(gè)領(lǐng)域得到成功應(yīng)用[16]、[17]。在計(jì)算機(jī)視覺中,楊等人[18]引入了一種基于圖的變換器架構(gòu),用于可變形圖像配準(zhǔn),以增強(qiáng)圖像特征表示中的長距離依賴性建模;而在自然語言處理中,王等人[19]使用GNN進(jìn)行文本分類,以捕捉上下文和語義關(guān)系。除了感知和語言任務(wù)外,基于GNN的方法在結(jié)構(gòu)化數(shù)據(jù)分析中也顯示出有效性[20]、[21]、[22];例如,Saquer等人[23]提出了一種基于注意力的圖神經(jīng)網(wǎng)絡(luò),用于通過將分子結(jié)構(gòu)建模為圖來進(jìn)行紅外光譜預(yù)測。
在高光譜圖像(HSI)分析中,基于GNN的方法特別有吸引力,因?yàn)镠SI數(shù)據(jù)具有內(nèi)在的光譜-空間特性[24]、[25]。孫等人[26]提出了一種帶有多注意力機(jī)制的編譯圖基網(wǎng)絡(luò),用于聯(lián)合建模光譜-空間依賴性,而蒲和王[27]開發(fā)了一種利用鄰域光譜關(guān)系的局部光譜圖神經(jīng)網(wǎng)絡(luò),以提高特征可分離性。盡管有這些進(jìn)展,HSI與NIRS有根本不同:HSI的特點(diǎn)是明確的空間鄰域和二維拓?fù)浣Y(jié)構(gòu),而NIRS通常是一維的,缺乏內(nèi)在的空間相關(guān)性[28]、[29]。然而,面向HSI的GNN建模策略在直接適應(yīng)NIRS分析時(shí)經(jīng)常遇到困難,因?yàn)樗鼈兛赡芎雎粤硕x非空間光譜數(shù)據(jù)的獨(dú)特變量級依賴性[30]。
為了解決這一限制,本研究提出了一種基于圖同構(gòu)網(wǎng)絡(luò)的多視圖圖譜建模框架,該網(wǎng)絡(luò)增強(qiáng)了節(jié)點(diǎn)級標(biāo)量注意力機(jī)制(NSA-GIN),用于食品質(zhì)量評估。首先使用五種光譜變換(SNV、SG^1、SG^2、SNV + SG^1和SNV + SG^2)將原始NIRS數(shù)據(jù)轉(zhuǎn)換為多個(gè)光譜視圖,從而從不同角度捕捉多樣化的光譜特征。在此基礎(chǔ)上,將得到的多視圖表示組織成圖結(jié)構(gòu),其中每個(gè)光譜視圖被視為一個(gè)節(jié)點(diǎn),并明確建模視圖之間的關(guān)系,以實(shí)現(xiàn)關(guān)系感知的信息交互。在此圖結(jié)構(gòu)的基礎(chǔ)上,所提出的NSA-GIN框架通過圖同構(gòu)卷積和節(jié)點(diǎn)級標(biāo)量注意力進(jìn)行跨視圖關(guān)系學(xué)習(xí),逐步提取出區(qū)分性的關(guān)系特征。為了進(jìn)一步鞏固學(xué)習(xí)到的表示,應(yīng)用多統(tǒng)計(jì)池化策略層次化融合局部和全局光譜信息,然后將聚合特征通過全連接頭映射到定量預(yù)測。該框架明確地將多視圖光譜表示與圖結(jié)構(gòu)關(guān)系學(xué)習(xí)相結(jié)合,為NIRS分析中的復(fù)雜依賴性建模提供了一種有效且可解釋的方法。
本研究的主要貢獻(xiàn)總結(jié)如下:
(1)構(gòu)建了兩個(gè)近紅外光譜數(shù)據(jù)集,涉及美國人參中的總?cè)藚⒃碥蘸陀衩鬃蚜V械牡鞍踪|(zhì)含量。
(2)提出了一種新的基于多視圖圖的NIRS建模算法NSA-GIN,以增強(qiáng)光譜間關(guān)系建模。
(3)廣泛的實(shí)驗(yàn)證明了所提模型在基于NIR的微量成分分析中的準(zhǔn)確性、魯棒性和實(shí)際有效性。