來源:賽斯拜克 發(fā)表時間:2023-08-17 瀏覽量:456 作者:awei
高光譜成像儀作為一種先進的遙感技術,具有同時獲取圖像和光譜的能力,廣泛應用于地質調查、環(huán)境監(jiān)測、農業(yè)管理等領域。地物識別分類是高光譜成像儀的重要應用之一,通過對地物的光譜信息進行分析,可以實現精確的分類和識別。本文將探討如何利用高光譜成像儀對地物進行識別分類。
高光譜成像技術的發(fā)展是上世紀末對地觀測的重大突破,是當前遙感領域前沿技術.高光譜成像波段數目多達幾百個,光譜分辨率高達幾個納米,包含豐富的空間輻射和光譜信息21.高光譜在獲得空間地物圖像的同時,每個像元可以獲得一條“連續(xù)”的光譜曲線[],所以高光譜遙感成為地面信息獲取,地物識別分類,礦物干度繪制的有力工具.盡管高光譜可以提供豐富的地面信息,但其較多的波段數使其數據量巨大,造成日前高光譜數據處理應用水平還遠遠滯后于成像光譜儀本身的發(fā)展.
高光譜可以提供地物連續(xù)光譜信息,因而在高光譜出現初期人們就研究如何利用“光譜信息”進行地物識別分類.傳統(tǒng)的分類技術處理高光譜高維數據時非常費時,更為嚴重的是傳統(tǒng)的分類技術是基于統(tǒng)計模式進行得,例如最小距離分類法,最大似然分類法.在分類的過程中一次和二次統(tǒng)計量(均值和協方差)都扮演重要角色.由于高光譜波段數增加導致數據維數急劇增加,因而用于參量估計所需的訓練樣本數目也急劇增加.如果訓練樣本數目滿足不了特征空間維數增加的要求,則估計出的統(tǒng)計量準確度就難以保證,也就得不到滿意的分類結果,最終導致的結果就是,當訓練樣本數目一定時,隨著高光譜影像維數的增加,分類準確度“先升后降”,即產生所謂的“Hughes現象”,
本文提出的基于端元(Endme mber2based)的分類方法不需要訓練樣本,通過特殊的主成分變換對高維數據進行“降維”處理,提取端元(endme mber)并對其進行識別,最后對整幅影像監(jiān)督分類.同時也
利用了“降維”后的數據進行了非監(jiān)督分類.利用了廣東賽斯拜克SineSpec所研制的高光譜成像儀的實驗數據,對影像所覆蓋的地物進行了基于端元的監(jiān)督分類和IsoData非監(jiān)督分類,并對兩者結果進行了比較.
1 實驗數據
實驗儀器為廣東賽斯拜克SineSpec所自行研制的大孔徑靜態(tài)干涉成像光譜儀(SC230),具有高能量通光力和光譜分辨率.波長范圍覆蓋了可見光和近紅外波段,包含128個波段,光譜分辨率可達3nm.本文采用的影像大小為324 MB,包含了豐富的地物資料,不同材料建造的房屋汽車草地小樹水泥路(有陰影和無陰影部分)等等.對ENVI提供的數據庫進行了重采樣使其與實驗數據的光譜相匹配.在沒有地面樣本信息情況下,完全依靠圖像本身數據對影像進行分類,期望達到不同種類的地物完全分開.
2 基于端元的監(jiān)督分類方法
圖1為基于端元的高光譜影像處理流程[,針對所處理影像的特點增加了最優(yōu)波段選取,端元代表一種物質或者材料具有唯一的光譜特性[1.理想情況下,一個端元代表一種純凈的物質,但是事實上由于地面狀況的復雜性以及地元分辨率的限制,在圖像上很難找到這樣的端元[8].利用傳感器得到的輻亮度數據經過大氣校正得到表觀反射率數據,去掉信噪比不好的波段和大氣吸收嚴重的波段,通過最小噪音變換(MNF)分離噪音減少后續(xù)運算量,通過像元純凈指數(PPI)計算減少空間維數據量并且找出純凈像元,n2維可視化(n2D Visualization)確定端元光譜,利用光譜庫進行端元光譜識別(ID)最后利用SAM分類技術對高光譜影像進行分類.
2.1大氣校正及輻射定標
輻射定標就是將遙感器獲得的輻射亮度DN值轉換為地物的表觀反射率值,這樣得出的光譜反身率才能直接與地面測量值,或者光譜庫中的值進行比較,便于進行光譜識別處理.高光譜數據嚴重地受到大氣影響°!,包括大氣散射吸收.吸收主要由水汽二氧化碳臭氧引起,散射主要由大氣中的固體顆粒引起,在中紅外波段可以利用CO?吸收帶2.005μm進行大氣校正,在可見光和近紅外波段利用水汽吸收帶0.69,0.72和0.76μm進行大氣校正.利用圖像本身的數據,通過建立大氣傳輸模型進行輻射定標,本文利用的數據是已經經過大氣校正的反射率數據.
2.2最優(yōu)波段選取
在空間維去掉成像質量非常差的區(qū)域,在光譜維把信噪比差的波段去掉,把大氣吸收嚴重的波段去掉,以有利于后續(xù)處理.由于前幾個波段信噪比差,而且光譜差異較小對分類沒有幫助,經調整后的波段范圍502~900nm舍棄了前39個波段,保留89個波段參與后面的處理.
2.3光譜維減少數據量:最小噪音變換(MNF)
MNF變換是一種特殊的主成分變換,MNF變換用于確定影像數據內在維數,隔離數據中的噪音減少后續(xù)處理計算需求[.MNF本質上通過兩次主成分變換來實現,第一步變換基于對噪音協方差矩陣的估計,對數據中的噪音去相關和歸一化,產生一個圖像序列,使得其中的噪音“白化”,即其中的噪音方差為1在序列之間是互不相關的;第二步是對
第一步產生的圖像序列實施標準的主成分變換.變換后各成分按照信噪比從大到小的順序來排列[2]最后數據分成兩部分:一部分與大的特征值相對應的特征圖像相關,其余部分與接近一致的特征值少及噪音占主導地位的圖像相關.這樣選取大特征催相對應的特征影像進行后續(xù)處理,去除噪音占主與地位的圖像,將會提高處理速度而且有利于提取純凈像元.
利用MNF變換對原始圖像進行最小噪音變換處理,把噪音從原始影像中分離出來.根據MNF特征值曲線(圖2),選取對應大特征值的前11波段影像進行后續(xù)處理,其它影像當作為噪音不參與后續(xù)處理.圖3顯示了從反射率圖像到MNF變換后的波段影像,可以看出,經過MNF變換后,波段越算后含有波譜信息越少,即噪音越多,所以去掉11波段以后的所有波段,降低數據維數利于影像的后續(xù)處理并且不會丟失有用光譜信息.
2.4空間減少數據量:產生像元純凈指數(PPI圖像純凈像元指數是一種在高光譜影像中尋找波譜最純凈像元的方法.把像元光譜與n維空間中的點一一對應時,則純凈像元所對應點應該在n維數據云的犄角.具體做法是,將n維散點圖重復投影到單位隨機向量上去,每次投影后,根據設置的閾值找出每次投影的極值像元(圖4),并對這些極值像元累計計數,產生一個像元純度指數圖.圖中像元的值代表該像元在投影過程中被標記為極值像元的次數l21.純像元就是像元純度指數圖中數值較大的那些像元.本文利用MNF變換后的前11波段進行PP運算,迭代次數設置為20000次,最后得到純凈像元數為1436.
2.5n維可視化進行端元選取
要進行n維可視化,首先要在PPI影像中定義感興趣區(qū).選取PPI像元值大于等于1的所有像元定義為感興趣區(qū)(ROI),然后導入到n2維可視化器進行端元選取.波譜可以看成是2維散點圖中的點,其中n為波段數,n2維空間中點的坐標由n個值組成,它們是某個給定像元相應每個波段中波譜輻亮度值或反射率值.這些點在n2維空間中的分布可以用來估計波譜的端元數.n2維可視化器為人們選取端元提供了一個交互式工具.在n2維可視化器中如果查看先前通過PPI閾值定義的那些純凈像元更為重要,它們是端元波譜的最佳代表,為人們確定端元波譜黛定基礎.利用MNF變換后的前11波段,把定義的感興趣區(qū)(純凈像元)導入n2維可視化器,然后通過旋轉2維散點云圖定義端元,最后選取5種端元光譜作為分類的5種物質(圖5).
2.6端元波譜識別
大多數高光譜數據分析方法,只是從影像中找到純凈物質或者是利用光譜庫中的光譜與影像中的光譜進行匹配,并不直接進行物質的識別.波譜分析也只是幫助進行波譜識別,并不能直接進行物質識別.該工具運用如二進制編碼波譜角分類以及波譜特征擬合等方法,對未知波譜即這里的端元波譜與波譜庫中的光譜進行匹配排序.也可以將自己定義的波譜擬合技術添加到波譜分析中,波譜分析的結果是輸入波譜庫要素的重排序表,由匹配度最好(得分最大)到匹配度最差(得分最小)排序.
端元波譜分析中利用了二進制編碼波譜角分類和波譜特征擬合三種方法.二進制編碼分類技術根據波段是低于或高于波譜平均值,將端元波譜編
碼為0或1.使用“異或”邏輯函數對每一種編碼的參考光譜和編碼的端元波譜進行比較,根據端元波譜與波譜庫中波譜匹配波段的多少來給出一個擬合度得分.
波譜角匹配12](SAM)技術是在n2維空間將像元(這里的端元)與參考波譜進行匹配.這一技術認為每一個像元波譜與n2維空間中的一個矢量相對
應,這里n為波段數.通過計算波譜間的角度a來判定兩個波譜間的相似度.夾角α越小說明兩個波譜越匹配,得出的匹配度分數就越高.α= arccosXY
,其中x,Y向量分別代表未知光譜和I|X Y參考光譜.
波譜特征擬合(SFF)是一種基于吸收特征的方法,它將參考波譜與未知波譜(這里的端元波譜)都進行包絡線去除,接著每條參考波譜都要按比例縮
放以匹配未知波譜1.逐波段地對每條參考波譜和未知波譜使用“最小二乘”擬合,最后生成一幅“匹配度"影像,它可以度量未知波譜與參考波譜之間匹配的程度.所謂包絡線去除(continuum re mo val)是將反射率波譜標準化的一種數學處理方法,它用來孤立特殊的吸收特征,然后對其進行分析.包絡線去除是一個在波譜頂部凸起的外殼擬合,它用直線段連接局部的波譜最大值,最后將原始波譜值除以包終線值,進行包絡線去除.
利用波譜分析時,二進制編碼波譜角分類和波譜特征擬合每種方法的權重設置為0.33,對波譜庫進行了重新采樣,使其與圖像波長范圍相匹配.
利用波譜分析器對每一種端元光譜都與五種光譜庫分別進行匹配(見圖6),根據得分的高低來決同的物質,然后利用這五種識別后的端元對整幅影定相應的分類.最后把五種端元光譜識別為五種不像進行分類.
2.7 基于端元的SAM分類及非監(jiān)督分類
利用前面介紹的波譜角分類技術,將已經識別出的端元光譜與未知波譜間最大角度α設為0.1弧度,對影像進行分類.分類結果如圖7(a).
IsoDat a非監(jiān)督分類法通過計算數據空間中均勻分布的類均值,然后用最小距離技術將剩余的像
元進行迭代聚集.每次迭代都將重新計算均值,且根據所得的新均值,對像元進行再分類.這一過程持續(xù)到每一類的像元變化少于所選的像元變化閾值或者達到了迭代的最大次數[.對MNF變換后的前11波段進行IsoData非監(jiān)督分類,結果見圖7(b).
基于端元的監(jiān)督分類需要人為提取并且識別端元,最后設置相應的閾值對感興趣區(qū)域進行分類.IsoDat a非監(jiān)督分類采用自動迭代聚類,在分類過程中并不需要人工參與太多.分類結果中白色矩形框所包含的區(qū)域為植物覆蓋區(qū),這在后來實地光譜測量中得到了證實.基于端元的監(jiān)督分類結果也很明確地把它劃分為植物覆蓋區(qū),但是在IsoData非監(jiān)督分類結果中卻沒有把植物和周圍地物分開.圖中橢圓形區(qū)域所覆蓋的兩屋頂光譜差異較大(光譜圖中得到),基于端元的監(jiān)督分類結果也很好的體現了這一點,但在非監(jiān)督分類結果中表現并不是很明顯總之,基于端元的監(jiān)督分類能夠更好地了解人們所感興趣的區(qū)域,也能夠提供更多的分類細節(jié).
3 結論
利用西安光機所研制的成像光譜儀(LASIS)對典型地物進行了識別分類.分析了傳統(tǒng)統(tǒng)計分類大法在高光譜數據應用中的缺陷,詳細闡述了基于端元的高光譜影像分類方法.利用特殊的主成分變換降低高光譜數據維數,克服了傳統(tǒng)分類技術“耗時”的特點(高維數據).整個處理過程不需要統(tǒng)計量估計,避免了“Hughes現象”限制,影像處理速度快而且效果較好.從分類的結果看,把地物分為不同種類例如房屋植物等是完全可以實現的,即使是同一類但是不同物質(反射率差異較大)也可以被區(qū)分出來.但是IsoData非監(jiān)督分類做不到這一點.由于實驗時草地生長并不是很茂盛,草地并不是完全被綠色覆蓋,草地分類效果不理想.還有水泥地的分類不理想,有陰影的水泥路沒有分出來.如果要進行植物種類的精細分類,把不同物種的植物分開,就實驗數據波長范圍和這種分類方法還不能完全做到.如何去除陰影的影響,提高大氣校正準確度,進一步提高高光譜識別分類準確度仍然是我們繼續(xù)研究的重點.
從實驗結果分析,利用本臺儀器數據完全可以實現不同種類地物分開.本文只是利用了高光譜中的光譜信息,完全沒有利用其提供的圖像信息.如果再加入一般圖像的模式識別方式來實現陰影部分的分類,這樣效果就會更好.