返回當前位置:主頁>應用案例>環(huán)境監(jiān)測
來源:賽斯拜克 發(fā)表時間:2023-10-13 瀏覽量:465 作者:awei
吉林查干湖是我國重要的湖泊之一,水體葉綠素A含量是評價湖泊水質(zhì)和生態(tài)環(huán)境狀況的重要指標。傳統(tǒng)的葉綠素A含量檢測方法通常涉及到水樣采集和實驗室分析,這種方法雖然準確但耗時且費用較高。因此,利用高光譜相機進行水體葉綠素A含量的無損快速檢測,具有重要的研究價值和應用前景。
研究方法:
數(shù)據(jù)收集:在吉林查干湖不同區(qū)域和時間段,使用高光譜相機獲取水體的反射光譜數(shù)據(jù)。同時,通過傳統(tǒng)方法采集水樣,測定葉綠素A的實際含量。
數(shù)據(jù)分析:對收集到的光譜數(shù)據(jù)進行預處理,提取與葉綠素A含量相關的特征波長。這些特征可能包括特定波長處的反射率、吸收峰等。
模型建立:利用化學計量學和機器學習算法,建立吉林查干湖水體葉綠素A含量與光譜特征之間的定量模型。可以采用線性或非線性回歸、支持向量機等算法進行建模。通過訓練和優(yōu)化模型,確定模型參數(shù)并評估模型的性能。
模型驗證:使用獨立的驗證數(shù)據(jù)集對建立的模型進行驗證。通過比較模型預測值與實測值之間的相關性、均方誤差等指標,評估模型的準確性和可靠性。
為了探討高光譜相機在水體葉綠素A含量的模型研究中的應用,本文以吉林省查干湖水體為例進行了研究。葉綠素A是水體中重要的成分,其濃度與水體中藻類的種類、數(shù)量以及水質(zhì)狀況密切相關。通過測定葉綠素A含量可以在一定程度上反映水質(zhì)狀況。然而,葉綠素遙感監(jiān)測存在著許多困難,比如水體中其他物質(zhì)的光學影響,以及藻類和其他污染物質(zhì)的差異等。這導致了在提取光譜特征時無法建立整體分析模型。
1實驗材料與方法
1.1研究區(qū)概況
查干湖主體處于前郭縣境內(nèi),小部分水體跨大安市和乾安縣.地處嫩江與霍林河交匯的水網(wǎng)地區(qū),屬內(nèi)陸半咸水湖泊,是吉林省最重要的漁業(yè)基地,也是松遼平原第一大湖、查干湖地處大陸性季風型半干旱
氣候區(qū),年均氣溫4.5℃,≥14℃的水溫日數(shù)145d;日照時數(shù)2880h,年均輻射量4429 MJ/m2,5月-9月份輻射量為2319MJ/m2;年均降雨量為450.8mm,蒸發(fā)量為1063.5mm;春季多大風,其中風速≥17m/s的日數(shù)年均29d;冰封期130d左右,結(jié)冰期日數(shù)150d左右,冰厚0.8-1.1m.該湖正常運行水位130m時,水域面積3.72×10?hm2,平均水深2.52m,水體容積5.98×10?m3;集水區(qū)內(nèi)均為鹽堿化農(nóng)田和牧場;湖底平坦,粉沙質(zhì)土壤,周圍土壤為白鈣堿土;湖泊水質(zhì)為蘇打型鹽堿水,多泥沙懸浮,透明度在20~50 cm之間,葉綠素a濃度7月份較高,在40μg/L左右,采樣期間其它月份一般在5-30μg/L左右(表1),屬富營養(yǎng)型湖泊.查干湖主要補給來源為引松工程,其次還有霍林河、洮兒河、嫩江、天然降水和地下水等為查干湖補給水源[,12]
1.2數(shù)據(jù)獲取方法
為研究查干湖水質(zhì),2004年5月到2005年6月,共進行了7次野外采樣,對研究區(qū)內(nèi)代表點位分別用GPS進行定位導向,同步測量各點水體透明度和反射光譜,并采集水樣,用以實驗室分析其他水質(zhì)參數(shù).7次采樣共計95點,隨機選取其中50個作為建模數(shù)據(jù),其余用以模型驗證.葉綠素a濃度的測定在采樣后,立即返回實驗室過濾,然后用丙酮萃取,蔽光24h后,采用分光光度計法測定.反射光譜測量采用用廣東賽斯拜克產(chǎn)品SineSpecSCX系列-成像高光譜相機進行相關研究。可在350-1050nm波長范圍內(nèi)進行連續(xù)測量,采樣間隔為1.4nm,光譜分辨率3nm,視場角25°,共有512個采樣值.
光譜測量時間為北京時10:00~14:00,7次采樣當時天氣晴朗無風,湖面基本平靜.光譜測量在距水面上方1m處進行,光譜儀傳感器探頭方向基本垂直于水面.在每個點位,進行20次反射光譜測量,最后取其平均值作為該點的光譜反射值,每個樣點測定前都進行白板定標.實驗室內(nèi)對每條平均反射光譜利用其在350-1000nm范圍內(nèi)的波段反射率進行歸一化處理,選取400-1000nm波譜范圍作為研究數(shù)據(jù).
1.3建模方法
數(shù)據(jù)處理與建模方法在水質(zhì)參數(shù)高光譜研究中起關鍵作用,在本研究中將主要從三個方面來對獲取數(shù)據(jù)加以分析,并在此基礎上建立模型.首先,分別對水體高光譜數(shù)據(jù)、微分光譜數(shù)據(jù)與同步獲取的對應采樣點水體葉綠素數(shù)據(jù)逐波段相關分析,并進行線性回歸分析.微分光譜采用以下公式計算:
R(λ;)2=〔R(A+)-R(A;-)〕/(λ;+y-λ;-1)
(1)
其中,λ,A;,λ?-1為相鄰波長,R(λ?)'為波長λ;的一階微分反射光譜.然后,采用光譜比值法建立水體葉綠素含量反演模型,評價不同比值法建立模型的精度;在此基礎上建立神經(jīng)網(wǎng)絡模型,將與水體葉綠素含量相關密切的波段作為輸入變量,反演水體葉綠素含量;最后對比分析不同方法建立的水體葉綠素a含量模型的精度.
2分析與討論
2.1光譜反射率特征
查干湖水體光譜反射率呈現(xiàn)典型的內(nèi)陸水體光譜特征(圖1).400-500 nm范圍內(nèi),由于葉綠素a在藍光波段的吸收峰及黃色物質(zhì)在該范圍的強烈吸收作用,水體的反射率較低[13],但由于懸浮物的影響,葉綠素a在440nm的吸收峰不是很明顯;510-620nm范圍的反射峰是由于葉綠素、胡蘿素弱吸收,細胞和懸浮顆粒的散射作用形成的[3],該反射峰值與色素組成有關,而且水體葉綠素濃度越高,該反射峰值也越高,可以作為葉綠素定量標志[14];630、675nm附近出現(xiàn)反射率低谷,630 nm低谷是由于藻青蛋白吸收引起[3],675mm是葉綠素a的又一吸收峰,因此當藻類密度較高時水體光譜反射率曲線在該處出現(xiàn)谷值1;685-715nm存在一個明顯的反射峰,一般認為是葉綠素a的熒光峰3,9,19,且會隨著葉綠素a濃度的增加而向長波方向移動[3],該反射峰的出現(xiàn)是含藻類水體最顯著的光譜特征,其存在與否通常被認為是判定水體是否含有藻類葉綠素的依據(jù),反射峰的位置和數(shù)值是葉綠素a濃度的指示(8).在近紅外的短波方向820nm左右存在一個懸浮物反射峰,而進入900 nm左右,水體反射率急劇下降.
2.2光譜反射率、微分光譜與水體葉綠素a含量的相關分析
微分光譜技術通過對反射光譜進行數(shù)學運算,可以迅速地確定光譜彎曲點及最大最小反射率的波長位置,微分技術對光譜信噪比非常敏感.研究表明,光譜的低階微分處理對噪聲影響敏感性較低,因而在實際應用中較有效[l?|.一般認為,可用一階微分處理去除部分線性或接近線性的背景、噪聲光譜對目標光譜(必須為非線性的)的影響[17].在本研究中,對采集的全部光譜數(shù)據(jù)按公式(1)進行了微分處理,然后將光譜反射率、微分光譜與水體葉綠素a含量數(shù)據(jù)進行線性相關分析與逐波段線性回歸分析、如圖2所示,光譜反射率與葉綠素濃度在400-600nm區(qū)間相關系數(shù)在0.45-0.5左右;600-730nm區(qū)間,相關系數(shù)在
0.55左右;730-900nm區(qū)間的相關系數(shù)在0.70左右.光譜反射率與葉綠素濃度在紅光與近紅外短波方向密切相關的現(xiàn)象在內(nèi)陸懸浮物多且富營養(yǎng)化水體中較為常見[1,8],這種現(xiàn)象目前還沒有給出其物理原因.從微分光譜與葉綠素濃度的相關系數(shù)的變化趨勢看,在藍、綠光波段相關系數(shù)較小,在紅光、近紅外的短波方向相關系數(shù)較高,但總體上沒有光譜反射率與水體葉綠素含量的相關系數(shù)高.
由以上分析表明,各波段光譜反射率、微分光譜與葉綠素a濃度的相關系數(shù)、線性回歸確定性系數(shù)普遍較低.這是由于查干湖多懸浮物,其高反射率掩蓋了水體中的葉綠素信息[19],同時本研究共計進行了7次采樣,時間跨度較大,因此在采樣過程中,外界環(huán)境不可避免會對采集的光譜值有一定的影響,水體各種組成成分的變化同樣會對光譜反射率產(chǎn)生影響,以上種種影響都會對葉綠素反演起到干擾作用.這與以往針對富營養(yǎng)化水體進行研究的結(jié)果相似[1].
2.3波段比值法回歸模型的構(gòu)建
采用反射比可以部分地消除水表面光滑度和微波隨時間和空間變化的干擾,并在一定程度上減小其他污染物的影響',5,20,21].在葉綠素遙感中,通常利用葉綠素濃度與光譜響應間的明顯特征,采用不同波段比值法擴大葉綠素吸收峰與葉綠素反射峰或熒光峰間的差異,提取葉綠素濃度信息[1,5,22,281.
我們采用葉綠素熒光峰(700nm)和葉綠素反射峰(580nm)兩個波段的反射率比值作為白變量,葉綠素濃度作為因變量,隨機提取50組數(shù)據(jù)建立回歸方程(圖3a):
Y=0.5554e?0s(R2=0.6239,N=50,P<0.01)
(1)
以剩余的46組數(shù)據(jù)對回歸模型(1)進行了驗證,并對所有樣本的預測值與實測值之間的關系進行了線性回歸,結(jié)果如圖(3b),從圖3b中可以看出,線性回歸的中心線與1:1線之間存在一定的偏離,而且回歸的確定性系數(shù)R2僅為0.5767,剩余殘差RMSE為5.87624(μg/L),表明模型預測結(jié)果不是很理想.
Koponcn等人發(fā)現(xiàn)!8.21],通過對光譜反射率值進行對數(shù)轉(zhuǎn)換,有助于對葉綠素a含量進行定量遙感.
因此對In(Ro/R?sn)和In(Chl-a)進行了對數(shù)處理,然后以隨機挑選的50組數(shù)據(jù)進行回歸,得到的回歸方程為:
y=1.4821e2501
(2)
式中,y為In(Chl-a);x為In(R/Rw)數(shù)值,回歸的確定性系數(shù)R2為0.7067、以剩余樣本對模型進行了驗證,并將全部樣本的實測值與預測值進行線性回歸,其方程為:
y =0.5727x +0.5628
(3)
最終回歸的確定性系數(shù)R2為0.6733,剩余殘差RMSE為4.8144μg/L.通過對比表明對數(shù)處理使回歸精度有了明顯提高,這主要是對數(shù)處理能夠?qū)ζx正常情況較大的數(shù)據(jù)起到歸一化作用,使數(shù)據(jù)更加收斂.
2.4葉綠素a含量的神經(jīng)網(wǎng)絡模型
人工神經(jīng)網(wǎng)絡是20世紀80年代中后期世界范圍內(nèi)迅速發(fā)展起來的一個前沿領域,因其良好的預測性和實用性被廣泛應用于各個領域,尤其在遙感影像自動分類與定量分析方面得到了廣泛應用4-261.由于BP神經(jīng)網(wǎng)絡具有并行處理、非線性、容錯性、自適應和自學習的特點,在數(shù)據(jù)擬合與模擬中有著無比的優(yōu)越性、因此本文嘗試采用BP神經(jīng)網(wǎng)絡,把多個波段的反射率作為輸入矢量來預測查干湖水體葉綠素a隨光譜反射率的變化,改善以往單波段或比值法建立模型參與波段少、反演精度低的缺陷.
本研究采用的BP神經(jīng)網(wǎng)絡模型是由Matlab的Neural Network Toolbox提供,網(wǎng)絡共有3層,依次為輸入層、隱藏層和輸出層.輸入層為不同診斷波段的光譜反射率,中間層的神經(jīng)元個數(shù)為2-10之間的可變因子;輸出層神經(jīng)元為1.中間隱藏層的激活函數(shù)為tansig,輸出層為purelin函數(shù),使得輸出結(jié)果不局限在0-1之間;訓練函數(shù)采用的是trainlm,該函數(shù)由Levenberg-Marquardt開發(fā),其特點是運算高效,收斂快.在96個水體葉綠素a數(shù)據(jù)中隨機抽取50個作為訓練樣本的學習目標T,將431 nm、681 nm、705nm、820 nm處的反射率作為輸入矢量P(選擇這4個波段的反射率主要是綜合考慮水體在可見光與紅邊處的光譜反射特征
差異較大,處于葉綠素吸收或反射峰值區(qū),而以人工神經(jīng)網(wǎng)絡來擬合實測數(shù)據(jù)需要尋求不同波段的互補優(yōu)
勢),中間隱藏層的神經(jīng)元可在2-10之間變動,輸出層神經(jīng)元為1,設置網(wǎng)絡學習的迭代次數(shù)為300.
當神經(jīng)網(wǎng)絡訓練完畢后,把剩余樣本的光譜數(shù)據(jù)作為輸入矢量P,進行模擬所得預測值與實測值進行
擬合,結(jié)果如圖4a所示.當隱藏層的節(jié)點數(shù)為8時,確定性系數(shù)R2與剩余殘差RMSE分別為0.9515、
1.8425μg/L.可以看出,神經(jīng)網(wǎng)絡的模擬精度遠遠高于單波段與比值法構(gòu)建的回歸模型.當隱藏層的節(jié)點數(shù)為2-9時,R2與RSME的變化情況以及二者的對比情況如表2.從表2可以看出隨著節(jié)點數(shù)量的增加,網(wǎng)絡的模擬精度在不斷增加,但也有個別情況下,節(jié)點數(shù)增大反而預測精度略有下降.一般而言,當節(jié)點數(shù)為7-9時,網(wǎng)絡的模擬精度已經(jīng)趨于穩(wěn)定,節(jié)點數(shù)的增加對模擬的精度不會有太大的提高,而且節(jié)點過多可能出現(xiàn)過度擬合.
由圖2b微分光譜與水體葉綠素a的線性回歸的趨勢可以發(fā)現(xiàn),水體葉綠素a與微分光譜在部分波段關系密切,因此在本研究中將580nm、700nm、800nm、860nm波長處的微分光譜作為輸入變量,進行了神經(jīng)網(wǎng)絡模擬,得到的結(jié)果如圖4b.從圖4b的結(jié)果可以看出,以微分光譜作為輸入變量的神經(jīng)網(wǎng)絡模型同樣可以收到良好的反演精度.筆者在本研究過程中,曾嘗試用不同波段的反射率以及微分光譜值作為輸入變量
進行神經(jīng)網(wǎng)絡模擬,都收到了良好的模擬結(jié)果;但是當輸入變量與水體葉綠素a濃度相關性較低時,神經(jīng)網(wǎng)絡的模擬精度就會有所下降,因此在神經(jīng)網(wǎng)絡模擬構(gòu)成中,所選擇的波段一定要與模擬目標有一定的相關性.唐軍武等211在黃東海水域使用412、443、490、510、555nm等波段也取得了較好的效果.目前,國內(nèi)外利用神經(jīng)網(wǎng)絡算法反演水質(zhì)參數(shù)多用于遙感影像,由于神經(jīng)網(wǎng)絡強大的模擬能力,一般來說精度都比較高,如Zhangl?]等利用神經(jīng)網(wǎng)絡模型在海岸帶水體取得了較好的效果.但是,神經(jīng)網(wǎng)絡模型提取葉綠素a的不足之處在于它需要大量的樣本(一般在50以上)來訓練與測試,因此在以神經(jīng)網(wǎng)絡模型進行水體葉綠素a反演時,一定要在大樣本事件的前提下進行,并且網(wǎng)絡的訓練以及隱藏層節(jié)點數(shù)都要合理控制,避免過度訓練與過度擬合現(xiàn)象的發(fā)生.
3結(jié)論
本文在分析查干湖水體反射光譜特征的基礎上,通過對光譜反射率與葉綠素a濃度之間的關系進行分析研究,結(jié)果表明:單波段光譜反射率與葉綠素a濃度的相關系數(shù)在藍、綠光波段為0.5左右,而在紅光以及近紅外短波方向,相關系數(shù)在0.5-0.7之間變化,并且隨著波長的遞增,相關系數(shù)有所增加.光譜反射率比值(R/Rn)與葉綠素a濃度之間密切相關,對二者進行對數(shù)處理后,回歸的精度有所提高,確定性系
數(shù)R2為0.7067,且兩者顯著性水平P<0.01,模型驗證也呈極顯著水平P<0.01,可以用來估算葉綠素a濃度.無論是逐波段線性回歸,還是比值法建立的模型,其反演精度都不是很高,但是神經(jīng)元網(wǎng)絡模型可以大大提高高光譜定量反演葉綠素a含量的精度,以光譜反射率或微分光譜與葉綠素a相關系數(shù)較大的波段作為輸入變量,都能夠收到良好的反演精度.