本文摘要:本中国土地科学论文以黄河三角洲地区垦利县一处典型区域为研究对象,以Landsat8遥感影像获取的土壤光谱信息为基础,通过光谱分析、光谱与土壤盐分的相关性分析,探索基于Landsat8遥感数据的土壤盐渍化信息提取方法,以期快速经济地提取土壤盐渍化定量信息,
本中国土地科学论文以黄河三角洲地区垦利县一处典型区域为研究对象,以Landsat8遥感影像获取的土壤光谱信息为基础,通过光谱分析、光谱与土壤盐分的相关性分析,探索基于Landsat8遥感数据的土壤盐渍化信息提取方法,以期快速经济地提取土壤盐渍化定量信息,为预报区域土壤盐渍化状况、制订综合治理措施、合理利用土地提供依据。
《中国土地科学》是由中国科协主管、中国土地学会和中国土地勘测规划院共同主办的中国土地科学领域惟一全国性学术期刊,也是中国土地学会会刊。《中国土地科学》[1] 是集中文核心期刊、中国科技核心期刊、中国人文社会科学核心期刊、中文社会科学引文索引期刊、中国科学引文数据库来源期刊、中国学术期刊引文期刊、SPCUE50家来源期刊和JI收录期刊于一身的权威学术刊物。
摘要: 土壤盐渍化是最常见的土壤退化过程,垦利县位于黄河三角洲核心地带,是土壤盐渍化比较典型的区域。本研究在盐渍土野外调查采样的基础上,依据土壤理化分析和Landsat8卫星光谱数据,选取了相关性以及诊断指数较好的3个波段的反射率作为盐分反演因子,分别建立数理统计模型与BP神经网络盐分反演模型。研究表明:BP神经网络模型的精度明显优于传统多元回归模型,且反演模型更适合高盐度区域土壤盐渍化反演制图,具有较好的应用前景。
关键词:BP神经网络;土壤盐渍化;Landsat8;黄河三角洲
盐渍化土壤是在一定环境条件下,诸多因素(特别是气候、地形、地质、水文和水文地质及生物因素)共同对水盐运动产生影响的结果1。土壤盐渍化通常出现在气候干旱、土壤蒸发强度大及地下水中含有较多可溶性盐类的地区。土壤性质不良、地下水位高过临界深度、毛细管水向上运动和土壤强烈蒸发,使土壤水中的盐分逐渐在土壤表层积累形成土壤盐渍化。土壤盐渍化不但造成资源的破坏和农业生产的巨大损失,而且还对生物圈和生态环境构成威胁。
黄河三角洲是我国重要的后备土地资源区,受河流、陆地、海洋等多种动力系统的作用,盐渍土面积大、分布广,土地盐渍化成了制约黄河三角洲区域经济发展的主要因素2。因此,土壤盐渍化的监测和预报成为开发利用盐渍土资源、实现当地农业可持续发展急需解决的研究课题,土壤盐渍化遥感提取与监测则是重要的研究手段。
目前,针对土壤盐渍化信息遥感提取的相关研究,多以TM、SPOT等多光谱影像为信息源,波段较少,对土壤盐渍化细微变化反映不明显。国外利用卫星遥感进行土壤盐渍化监测研究始于20世纪70年代,90年代以来,遥感数据源更加丰富,方法日趋成熟。盐渍土信息的提取主要是基于光谱响应特征。 Dwivedi等3对盐渍土监测的最佳波段组合进行试验研究,单纯从信息量来衡量,TM数据1、3和5波段组合所含信息量最大,但盐渍土信息提取的精度并不与遥感数据信息量的大小成正比关系。Ben-Dor等4利用DAIS-7915传感器的高光谱数据定量反演了土壤湿度信息,通过土壤湿度参数间接反演土壤盐分。国内学者也进行了相关研究,关元秀等5先对TM数据作缨帽变换,对亮度、绿度和湿度分量进行假彩色合成,然后再监督分类,将黄河三角洲土地盐碱化的现状分为4个等级。吴阳春6利用最小二乘支持向量机回归分析方法建立了松辽平原盐渍土土壤盐分关系模型,揭示了环境减灾卫星在土壤盐渍化中的监测和盐分定量估算的能力。
1研究区概况与数据
1.1研究区概况
研究区在黄河三角洲核心区域垦利县,地处东经118°35′19.26″~118°50′25.94″,北纬37°31′22.22″ ~37°44′06.47″,属于黄河冲积平原,温带季风型大陆性气候,其成土过程短,土层薄,加之当地区域地势低平,地下水位高,矿化度大,多年平均降水量为600 mm,平均蒸发量1 944 mm,蒸降比达3∶1,毛细管作用强烈,盐分容易升至地表,导致土壤大面积盐渍化7。
1.2基础数据
来源于东营市1∶100 000比例尺土地利用现状图,中国科学院地理科学与资源研究所提供的数据,以及黄河三角洲地区2002、2003、2006年土壤采集样品的pH值、全盐量、有机质、八大离子的化验数据。
1.3野外实测盐分数据
野外采集土壤样本的时间为2014年4月下旬的4天,此时该地区大部分农田闲耕,土壤裸露,光板地上有斑块插花分布的枯败翅碱蓬、柽柳或芦苇。为了保持数据的准确性,将野外采集时间定在10∶00~14∶30之间,与Landsat8遥感影像的获取时间基本同步,以便合理地提取土壤含盐量信息。选择地势平坦、地表裸露的研究区域进行采样,共选择了50处采集点:耕地13处,草地8处,芦苇地10处,裸地7处,棉花地9处,林地3处。记录每处位置坐标,在50 m×50 m的采样单元范围内,均匀混合2~4份表层0~10 cm的土壤样本,风干后适当研磨,装入容器待用。委托东营市城市管理局园林绿化处进行全盐量化验,使用土壤电导率仪DDSJ-308A测量,电导率法求得土壤中可溶盐分总量(表1)。
1.4Landsat8影像介绍
Landsat8卫星由美国地质调查局于2013年2月11日发射,是Landsat系列对地观测遥感卫星的最新型号。Landsat8首次采用推扫式成像扫描方式,该卫星搭载了OLI和TIRS两个传感器,其中OLI共包括9个波段:1个空间分辨率为15 m的全色波段,7个空间分辨率为30 m的多光谱波段,以及1个中心波长为1.3730 μm卷云(Cirrus)识别波段;TIRS则设置了两个热红外波段8。
本研究采用从USGS网站上下载的2014年5月1日云覆盖量为3.29%的Landsat8多光谱影像。第一步:对下载卫星影像进行预处理,主要包括几何校正、辐射定标和Flaash大气校正。由MTL文件可知Y方向的几何误差为5.267 m,X方向的几何误差为5.236 m,满足几何精度要求。随后进行辐射定标。用ENVI工具箱对多光谱数据进行FLAASH大气校正,经过大气校正后的光谱反射率已无明显的大气、水汽等吸收特征,较好地体现出地物真实的光谱特征。第二步:对影像进行裁剪,建立感兴趣区,裁剪后得到研究区域。研究区假彩色合成图及其采样点分布如图2所示。
2数据处理
2.1盐渍土光谱曲线特征分析
将研究区50个土壤光谱按盐分含量对反射率曲线分为5组,组内土样光谱反射率取均值,结果见图3,可以看出曲线总体形态和趋势是一致的,即光谱反射率在可见光和近红外部分不高,呈增大趋势,在短波红外波段达最高后,随着土壤盐渍化程度的加重,又呈现降低趋势。该研究区土样为氯化物型滨海盐土,富含NaCl和MgCl2,而氯化物极易吸收空气中的水分,因此,盐渍化程度越高的土壤其光谱反射率越低9。
2.2特征波段的选择
通过研究遥感影像中盐渍化土壤光谱曲线的光谱特征,选择出能够定量反演研究区土壤盐分含量的光谱反射率敏感波段,计算实测光谱在各波段的反射率值的均方差、反射率值与土壤盐分含量之间的相关系数和诊断指数,以期建立可靠的预测方程,进行定量化制图。
2.2.1单波段光谱反射率与盐分的相关分析将Landsat8遥感影像中对50个采样点7个波段的多光谱反射率数据与采样点的土壤盐分含量数据进行相关性分析,从单相关系数的计算结果(表2)可以看出,监测点土壤盐分与实测地面光谱反射率值呈负相关;在第5、6、7波段的相关性明显高于前4 个波段的,因此,土壤含盐量在近红外波和短波红外波段与光谱反射率相关系数比较大。
2.2.2获得土壤含盐量的诊断光谱各种地物具有丰富且独特的波谱信息,进行光谱诊断的目的,就是要从丰富的光谱信息中提取最能反映样本间差异的波段。本文所用的诊断指数,主要用于研究Landsat8多光谱各个波段对土壤盐分含量的敏感程度的差异。诊断指数Pi的计算公式如下:
Pi=σi×Ri
式中σi为样本光谱曲线在波段i上反射率值的标准差,Ri为波段i上的反射率数值与土壤盐分含量之间的相关系数。分别计算出Landsat8遥感影像1~7波段的Ri、σi、Pi,结果见表2。
3统计模型的建立与应用
由以上光谱分析可知,研究区的土壤反射率数据在第5、6、7波段与土壤盐分含量数据存在较好的相关关系。为了将两者的关系进一步量化,尝试建立了两者的统计模型。从50个样本中剔除不佳采样点以及仪器或人为操作而造成的畸异值5个,将剩下的45个样本随机分成两组:一组35个土壤样本,用于建立回归预测模型;另一组10个土壤样本,作为检验样本用于验证建立的模型。
对获取的采样点影像各波段反射率进行倒数、对数、对数的倒数变换,以土壤盐分含量作为因变量,对应的地表反射率及其数学变换形式作为自变量,进行多元线性回归分析11。模型的稳定性用判定系数R2和调整的判定系数R2检验。用判定系数R2进行的检验称为拟合优度检验,R2越大,模型的拟合度越高。引进经调整的判定系数(Adjusted R2),能够消除自变量个数以及样本大小对判定系数的影响。模型的预测能力用总均方根差(RMSE,来自建模与检验样本)来检验,RMSE越小,模拟值和测量值之间的偏差越小,预测能力越强。
由表5可知,用多元线性回归模型预测得到的结果中,最大的相对误差达到了242.22%,最小的相对误差为1.53%,大部分样本点的残差和相对误差较大,可见利用建立好的多元线性回归模型反演精度不够理想。这主要是因为土壤光谱是诸多因素共同作用的结果,土壤含盐量的反演比较复杂,并不是一个简单的线性问题10。
4BP 神经网络模型的建立与应用
BP神经网络是20世纪80年代后发展起来的,具有训练速度快、非线性映射能力强等优点,可以为土壤含盐量的反演提供一种新的方法和手段。
4.1BP神经网络原理
人工神经网络技术(ANN)是模拟基本结构和功能建立的分布式并行信息处理算法的数学模型。目前人工神经网络模型有多种,比较典型的有BP神经网络、Hopfield网络及BAM网络等。其中,BP神经网络是一种按误差逆传播算法训练的多层前馈网络,常用于复杂的非线性数学计算,其基本思想是把学习过程分为两阶段:第一阶段是信号的正向传播过程,通过输入层、隐含层逐层处理并计算各个单元的输出值;第二阶段是误差的反向传递过程,若在输出层未能得到期望的输出值,则逐层递归地计算实际输出和期望输出的差值(即误差),以便根据此差值调节权值。这种过程不断迭代,调整权值使网络总误差最小,从而达到预期的学习目的12。
4.2模型的建立与应用
设计BP神经网络时主要考虑网络的层数、每层中的神经元个数和激活函数、初始值以及学习速率等几个方面。本研究应用Matlab7.0构建 BP神经网络模型来反演土壤盐分含量,数据分成两组:35个训练样本,10个测试样本。选取Landsat8的第5、6、7波段反射率数据倒数作为神经网络的输入层,根据本试验的要求,单隐含层即可达到建模要求,输出层1个节点对应于土壤盐分含量。采用逐步增长法来确定隐含层的节点数:反复试验5到15个节点,计算得到训练样本的神经网络模型在隐含层节点数不同情况下训练样本的均方根误差RMSE和决定系数R2,见表4,并综合考虑时间效率和模拟效果,最终将隐含层的节点数确定为11个。
神经网络训练前首先对样本数据做归一化处理,训练完毕再反归一化。隐含层传递函数选择tansig函数,输出层选择logsig型非线性传输函数,使整个网络的输出可以限制在较小的范围。训练函数的选择是关键,研究中采用traingdx(自适应调整学习率并附加动量因子的梯度下降反向传播算法)、trainlm(L-M优化算法)和trainscg(反向传播算法)三种训练算法分别进行训练,trainlm函数收敛速度快,但易过度匹配;trainscg函数实验时训练样本拟合度好,但泛化能力差;traingdx能够自适应调整学习速率,可以缩短训练时间,一旦网络误差平方和小于期望差,网络便提前终止。本模型最大迭代次数4 000次,目标误差0.001,初始学习速率为0.01,各个参数、传递函数、训练函数等是经过多次试验比较而得出,并非是最优结果。
由表5可以看出,BP神经网络模型反演精度,最大的相对误差为57.08% ,最小相对误差为1.46%,平均相对误差为24.32%,与多元线性回归模型51.26%相比,BP神经网络模型反演实际精度高,更接近真实的土壤盐分含量值。但神经网络需要较多的时间进行网络训练与迭代运算。当土壤含盐量高时,BP神经网络反演结果误差较小,说明利用Landsat8遥感影像,更适合反演高盐度区域的土壤含盐量。在制图时用阈值NDVI≥0.25来提取植被,利用归一化差异水体指数(MNDWI)提取水体,由于建筑与裸地混分严重,用土地利用现状图经过多次掩膜,提取土壤信息,用BP神经网络模型反演生成土壤盐分含量图,进行3×3低通滤波去噪。依据半湿润地区盐碱土分级标准,制成研究区土壤盐渍化程度空间分布图13,见图5。将研究区中的用地分为非盐渍化、轻度盐渍化、中度盐渍化、重度盐渍化、盐土以及水体、植被和居民地8类。由图 5可以看出,北部靠近黄河的五七灌区大部分为非盐渍化区域,说明人为因素对盐渍化的分布有较大影响;而在中部水库与河流附近,盐渍化程度较高,这与其微地形有关,地势低洼的地方易于积水积盐,符合研究区——垦利县的实际情况。总体而言,整个研究区以非盐渍化和轻度盐渍化为主,占比62.7%,盐土级别占比 9.6%。
5结论
以黄河三角洲典型盐渍化区域为对象,在野外调查采样和分析基础上,重点研究利用土样盐分信息与Landsat8卫星多光谱数据基于BP神经网络模型定量反演土壤盐渍化信息,得出了以下结论:
①利用多元逐步回归模型建立的方程,建立了表层土壤含盐量和Landsat8多光谱之间的定量关系,模型决定系数为0.75。所建立的多元回归模型反演精度不够理想。
②BP神经网络预测盐渍土盐分的性能比传统多元回归方法更精确,应用BP神经网络方法反演盐渍土盐分含量是可行的,具有较好的精度和稳定性,可制作研究区土壤盐渍化程度空间分布图。
③不足之处:采用BP神经网络方法得出的结果并不是最优解。因此,需要对BP神经网络在训练算法和训练策略方面进一步改进,应用高光谱数据建模是下一个方向。本研究中未考虑盐渍土与地下水埋深、地下水矿化度、地形、气候等因素的关系,若能综合考虑建立模型,表达的结果将更加合理与准确。
转载请注明来自发表学术论文网:http://www.fbxslw.com/nylw/9185.html