高光谱成像仪在对样本进行扫描时,可以获得样本的高光谱图像数据,但由于高光谱数据量过大,会降低后期的数据处理速度,并且波段较多,光谱信息之间相关性很强,使得三维数据块之间存在大量冗余信息,可能影响建模结果,因此就需要对光谱数据进行处理。本文对高光谱成像仪样品检测步骤及光谱图像数据分析方法做了介绍。
1.样品选择
筛选建模集和预测集样本,要求样本对需要检测的指标具有很好的代表性,且建模集的样品能覆盖预测集的样品的分布。然后采用常规实验方法准确测试待测指标,获取参照数据。
2.光谱图像获取
用多光谱仪扫描样本,获取其光谱图像。为了确保测试的稳定性,必须严格控制包括样品准备、测试条件、仪器参数等条件。
3.图像预处理
图像的预处理是图像分析过程中的一个重要环节。图像由于图像采集环境的不同,光照明暗程度不同、设备性能的优劣、样品浓度不均匀、人为操作等都会带来不同的噪声。为了保证图像中被测物大小,位置及图像质量的一致性,提高光谱质量,必须对图像进行预处理。图像预处理有两种基本方法,包括对像素值的预处理和领域预处理。
4.图像分割
图像分割是图像处理过程中的关键步骤之一,是后续工作能够有效进行的关键技术。图像分割是将图像中有意义的特征部分提取出来,包括图像中的边缘、区域等。目前已经研究出不同分割的种类和方法,但还没有统一的方法可以适用于所有的图像处理中。图像分割结果的好坏需要根据具体的要求进行衡量。常见的图像分割的方法很多,如阈值法、特征空间聚类法、区域分割法等。
5.特征提取
特征提取是图像处理中最初级的运算,指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征,把识别后的图像特征从图像中抽取的过程。常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征等。图像特征提取是一门交叉性的学科,涉及数学、物理学、控制理论、计算机科学等多个方面的知识。
6.建立校准模型
利用所提取的图像特征作为输入,用化学计量学方法关联样本的预处理光谱数据和参照数据,通过一定的数学计算方法计算出关联模型。常用的化学计量学法有PCA,PLSR,LS-SVM,BPNN等。
7.建立预测模型
使用预测集的样品来检验建立的校准模型的稳定性。对实际值与预测值作线性相关,并用相关系数和预测标准差来表示预测效果,好的预测模型要求相关系数接近1、预测标准差逼近于校准标准差。
8.未知样品的检测
用多光谱仪对未知样本进行扫描,获取光谱数据,根据已建立的预测模型和测得的光谱数据对于样品进行预测。
高光谱图像处理分析方法不胜枚举,在图谱数据处理过程中,有如下基础方法。
1.高光谱图像预处理
高光谱图像因其携带大量的数据信息,增强了技术的检测能力,同时也增大了信息的冗余量,因此在预处理阶段的主要目的即对立体数据进行降维处理。在保存感兴趣特征的同时减少数据信息量,降低处理信息的时长与难度同时增强数据分析的精确度。目前,较为普遍的高光谱图像预处理方法有特征选择和特征提取两种方法。
特征选择是指从最初波段中直接选取有效的特征波段,达到降低数据维度的目的。特征提取是指通过对一个或若干个原始波段的属性关系进行组合变换,得到新的特征属性。光谱信息的冗余量与相关性取决于波段的宽窄度,因而选取最优波段是图像降维度过程的关键要素。实际检验鉴定中常通过多种降维方法交叉结合使用,来达到最佳的检验结果。如基于主成分分析、基于高阶统计量的独立元分析、最小噪声分离变换、傅里叶变换、基于核函数和基于神经网络的非线性特征分析等。
2.数据特征分析
根据检材在光谱图中的不同特性信息反映,选取不同分类模型对不同类别的待测目标进行分类。使用计算机分析处理作为辅助方法,弥补鉴定人员的视觉鉴别传统方法的不足,如最大似然比分类、卷积神经网络分类方法等等。作为机器学习方法之一的监督学习,通过对已知标签的特征进行提取学习,构造训练函数完成对未知样本的分类检验任务,如K近邻法、马氏距离分类、最大似然法、最小距离法、光谱角分类法等等。另一种非监督分类则是直接对光谱信息进行特征提取,统计差别进行分类,如K-均值、ISODATA(迭代自组织数据分析)等。对高光谱图进行数据分析的过程中,通过总体分类精度对分类方法进行评价,选择最有效的分类方法而获得最佳结果。
高光谱数据是一个三维数据块,不仅可以提取每个像元的光谱信息,而且每个波长都对应一幅灰度图像。但是,对于分辨率较高的高光谱数据,每个数据块就包含上百幅图像信息,数据量过大,会降低后期的数据处理速度,并且波段较多,光谱信息之间相关性很强,使得三维数据块之间存在大量冗余信息,可能影响建模结果。因此,在数据处理过程中,高光谱数据的降维是减小噪声,提高模型识别速率和识别准确率的有效手段。目前的主要的降维方法有以下两种:
1.主成分分析(PCA)
主成分分析(PCA)是被较多应用的一种数据降维方法。PCA变换是将有相关性的原始变量沿协方差最大的方向投影,使经过坐标变换的高维空间数据映射到低维空间,得到线性不相关的新变量,即主成分。主成分按照方差从大到小的顺序依次称为第一主成分(PC1)、第二主成分(PC2),以此类推。原始高光谱数据经过PCA变换,可以看作各个主成分图像的线性组合,主成分图像所占原始图像信息的比重由方差贡献率决定。一般,当主成分的累计贡献率达到一定比例,如85%以上,即可解释大部分高光谱数据信息。因此,经过PCA变换的高光谱数据仅需少量主成分就可以极大程度上表征原始信息,大大减少了数据处理时间,并消除原始数据之间冗余的信息。
2.最小噪声分离变换(MNF)
对于高光谱数据降维,最小噪声分离变换(MNF变换)的主要目的在于分离高光谱数据的信号和噪声,提高信噪比。该算法可以看作是两次主成分变换的叠加。首先,基于图像噪声的协方差矩阵进行正向变换,然后,对多维图像去相关、重定标。变换之后的数据关联到两个部分:一个部分是较大特征值,及其特征图像;另一个部分则是较小特征值,及其噪声图像。特征值的大小决定特征图像的信噪比高低,用来确定有效的特征图像。最后,正向变换后确定的图像子集被作标准主成分变换,恢复为对应的原始图像。MNF将噪声比例大的图像排除,使有效的高光谱数据量大幅度上涨。
电话:13376066805
邮件:sales0019@3nh.com