您好、欢迎来到现金彩票网!
当前位置:21点 > 字冗余 >

基于冗余字典的图像稀疏表示分析-image sparse representation a

发布时间:2019-06-10 17:49 来源:未知 编辑:admin

  基于冗余字典的图像稀疏表示分析-image sparse representation analysis based on redundancy dictionary.docx

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  摘要I摘要近几年来,稀疏表示的研究进入一个全新发展的时期,稀疏表示应用到图像处理的各个领域,如人脸识别、图像去噪、图像分割、图像压缩等。通过样本学习获得字典,任意信号均可以用少量原子的线性组合来表示。得到的稀疏的系数向量,就可以几乎精确的重建原信号。本文基于冗余字典能捕捉原始信号的鲁棒特征的优势,研究其在图像去噪中应用。本文主要的研究内容如下:(1)研究基于冗余字典的图像分块稀疏表示的去噪算法。首先对图像进行分块,借助贝叶斯重构思想,获取图像块的鲁棒近似稀疏表示,然后通过稀疏表示系数得到无噪图像的近似表示。(2)研究基于字典学习的自适应图像稀疏表示去噪方法。首先借鉴K-SVD算法,初始化过完备字典,通过噪声图像块训练字典,然后应用学习得到的字典对噪声图像进行稀释表示并去噪。训练后的字典能更有效的表示图像内容,去噪效果更明显。通过自然图像的去噪实验验证算法的有效性。实验结果表明该方法对在图像去噪方面有着很好的效果。(3)应用一种新的字典构造思想,采用类似压缩感知的结构自适应稀疏表示图像,并参照K-SVD方法更新字典原子获得新字典。在此字典下得到系数能更有效的稀疏表示信号。最后将该方法用于CT图像的去噪问题。实验结果表明,基于此种字典的稀疏表示算法,在处理大字典和高维数据方面具有一定的优势。本论文工作得到了国家自然科学基金(No.60703109)和博士点基金(No.)资助。关键词:冗余字典稀疏表示图像去噪字典学习稀疏字典estigateanadaptivemethodofimagesparserepresentationdenoisingbasedondictionarylearning.FirstlyowingtotheK-SVDalgorithm,weinitializeovercompletedictionary,trainthedictionaryontheimagepatchesanddenoiseimagebyusingthelearneddictionary.Thetraineddictionaryexpressestheimagecontentseffectivelyanddenoiseimagebetter.Weusednaturalimagedenoisingexperimenttoshowthevalidityofthismethod.Theresultsfromtheseexperimentssaidthatthismethodhasverywellperformanceinimagedenoising.Applyinganewideaofdesigningdictionary,weusethestructurelikecompressionsensetogetadaptiveimagesparserepresentation.WeupdatedictionaryonasimilarplanwithK-SVDandgettheupdateddictionary.Therepresentationcoefficientsbasedonthedictionarycouldhaveasparsesignalrepresentation.ThenweapplythismethodtotheCTimagesdenoising.Theexperiments’resultsindicatethatthealgorithmofsparserepresentationbasedonsuchdictionarieshashighconvergenceindealingwithlargedictionariesandhigh-dimensiondata.ThisdissertationissupportedbyNationalNaturalScienceFoundationofChina(No.60703109)andtheNationalResearchFoundationfortheDoctoralProgramofHigherEducationofChina(No.)Keywords:redundantdictionarysparserepresentationimagedenoisingdictionarylearningsparsedictionary目录I目录摘要................................................................IABSTRACT..........................................................III第一章绪论.........................................................11.1研究背景.......................................................11.2研究现状.......................................................21.3论文的研究内容及架构安排.......................................4第二章图像信号的稀疏表示...........................................52.1引言...........................................................52.2信号的稀疏逼近.................................................52.3信号的稀疏分解.................................................62.3.1基追踪.....................................................62.3.2匹配跟踪...................................................62.3.3正交匹配跟踪...............................................72.3.4过完备不相干级联原子库.....................................92.4图像的稀疏表示.................................................92.5本章小结......................................................10第三章基于冗余字典的图像滑窗分块稀疏表示去噪......................113.1图像去噪......................................................113.1.1去噪问题描述..............................................113.1.2噪声模型..................................................113.1.3去噪效果评价...............................................123.2基于冗余字典的图像分块稀疏表示去噪............................133.2.1图像取块..................................................143.2.2块到整体..................................................143.2.3数值解决..................................................153.2.4字典选择..................................................163.3实验及其分析..................................................163.4本章小结......................................................20第四章基于字典学习的自适应稀疏表示去噪............................214.1引言..........................................................214.2字典训练......................................................214.2.1奇异值分解................................................214.2.2稀疏表示与聚类............................................224.2.3K-SVD字典训练算法234.3基于字典学习的自适应图像稀疏表示去噪..........................244.3.1算法说明..................................................254.3.2实验及其分析..............................................264.4基于稀疏表示的SAR图像去噪294.5本章小结......................................................32II基于冗余字典的图像稀疏表示研究第五章基于字典稀疏的图像稀疏表示去噪..............................335.1引言...........................................................335.2稀疏字典.......................................................335.2.1引入稀疏字典的原因.........................................335.2.2稀疏字典模型...............................................345.3稀疏字典学习...................................................355.4实验及其分析...................................................375.4.1高维信号的应用.............................................37CT图像去噪395.5本章总结.......................................................42第六章总结和展望..................................................436.1本文总结.......................................................436.2展望...........................................................43致谢...............................................................45参考文献...........................................................47第一章绪论1.1研究背景随着社会经济和科学技术的高速进步,使得人类对于信息的需求也越来越重要,各种各样的能传达信息的载体也在频繁应用,比如文字、音频、图像和视频等,在人类的进步中起着举足轻重的作用。而在这其中,图像因为具有大的信息量,较快的传输速度,较远的作用距离,再加上视觉上的一些优良的特点,使它成为人类非常依赖的获取所需信息的重要方法。基于这个原因,其他领域中渗透进去图像处理的应用技术也是大势所趋。因此近几年来吸引到很多的学者投身到这个领域,做出了一定的贡献和成果[1]。在信号处理和图像处理中,对图像和信号的表示方式研究一直是个根本的问题,关系到信号处理和图像处理的各个方面。用尽可能简洁的方式表示图像信号,将为图像或者信号的处理带来极大的方便。信号与图像的稀疏表示就是尽量追求信号和图像的一种最简洁的表达方式,这个取得图像或者信号的稀疏表示过程,就是该信号的稀疏分解过程。代表就是Mallat在1993年提出的稀疏表示思想[2],拓展了信号表示的一个新的研究领域。现在存在着很多的信号处理方法,目标就是找到一种信号的稀疏表示,用逼近的信号取代原始信号来达到降低对信号进行处理所花销的成本,提高信号压缩的效率。传统的信号表示理论是在正交的线性变换基础上的,但现实中很多的信号是自然的现象的混合体,在单一的正交基变换中并不能有效地表现出这些混合的信号。就像一个正弦波形和脉冲的混合信号,不能单独的只用其中一个的基函数来表示这个混合信号,因为这种处理的结果并不好。这个例子在信号里有两种结构类型同时出现,但它们却完全不同,因此不管哪一个都不能有效地表示另外一个。所以人们希望寻找一种信号表示同时建立在两种结构函数之上,结果肯定会比采用单一一种基函数有效的多。传统的处理视频和图像的信号表示方式是基于非冗余的正交变换,就像离散余弦变换、小波变换。DCT因为其基函数缺乏空间/时间分辨率,因而对于具有时频局部化特性的信号特征不能有效地提取。对于处理低维数据小波变换具有点状奇异性的特征,因此效果比较好,但是缺点就是处理图像线状奇异性并不好,因为图像的边缘是按空间不连续分布的,因此小波不具有人眼的方向敏感特性。新的信号稀疏表示理论的基本思想是:用过完备字典取代基函数,字典尽可能好地符合被稀疏逼近信号的结构,可以任意的构造字典,字典中的列称之为原子。基于字典中找到最优的几个原子线性组合去表示信号,称作信号的稀疏逼近或者高度非线性逼近。因为稀疏表示在信号领域表现出很好的特点,在二维图像的研究上也应用到稀疏表示[3,4],随着压缩感知[5,6,7]的提出,使稀疏表示更加引起国内外科学研究者的重视,随之投入到稀疏表示的研究当中。稀疏表示的理论基础:给定一个集合D??{??,????1,2,?,?},其元素?是能够张成Hilbert空间RN的单??位矢量。在稀疏表示理论中,称D为原子库,也叫做字典,???被称为字典D的一个原子,??远大于N。对任意给定空间里的信号y都可以用字典D中原子的线性组合来表示y,即y????????????(1-1)其中???为y在原子???上的分解表示系数。因为??远大于N,字典D是过完备的,因此式(1-1)中y的分解结果有许多种解答,因此根据需求可以选择最为合适的分解表示系数???。而在本文中数字图像处理领域是寻找信号最稀疏的表示,即系数向量中大部分分量为零,非零元素的个数很少。在数学上,求解超完备稀疏表示模型等价于求欠定系统的最稀疏解,Donoho[8]和Gribonval[9]证明了最稀疏解在特定条件下的唯一性,并给出定理1.1:定理1.1:如果某一稀疏解??在已给的欠定系统中满足??0??spark(?)/2,其中??是字典D所对应的合成矩阵,spark(?)表示??中任意的一组原子线性相关时所需要的最小个数,则该解是唯一的并且是最稀疏的。此定理表明尽管字典的冗余性导致分解系数非唯一,但对于满足特定Spark条件的字典,存在唯一的最稀疏解。把稀疏分解归结为解决下述问题argmin??0?s.t.y????(1-2)其中??0为?0范数,从随机的冗余字典中求解这一问题是NP难问题。为了解决这一个难点,Donoho[10]和Candes[11]提出解决下面的问题:argmin??1?s.t.y????(1-3)经过这一修改,转化了问题的性质,最小化?1范数是比较简单的问题,此时称为BasicPursuit或BP,可以通过线研究现状从开始的傅里叶变换提出以后,稀疏表示就进入逐渐的发展,比如现在流行的JPEG国际静止图像压缩标准是基于离散余弦变换的,MPEG视频压缩标准也是基于离散余弦变换的。小波变换在傅里叶变换之后被提出,应用到图像稀疏表示方面被证明是有效地方法,像JPEG2000国际静止图像压缩标准就是基于小波变换推出的。因为基函数缺乏时间空间分辨率,使离散余弦变换对于提取具有时频局部特征的信号不是很有效。在处理低维数据时小波变换具有点状奇异性的特征,因此效果比较好,但是缺点就是处理图像线状奇异性的时并不好,因为图像的边缘是按空间不连续分布的,因此小波不具有人眼的方向敏感特性。后来提出的多尺度几何分析方法,揭示了人眼的方向视觉特性,因此相继出现了好多具有方向性的稀疏表示方法。以上这三种方法的原理都是如何寻找在不同的函数空间中提供一种更加直接简单的表示信号的方式,所有这些变换都是为了找到图像的特征并对其进行稀疏分解,然后用一组空间基表示信号的稀疏程度。再到后来的基于超完备的理论,学者们通过构造过完备字典的方法,实现图像信号的稀疏表示。因为字典中的原子能更好的代表图像信号的结构,符合人类的视觉特性,因此基于这种方法的稀疏表示的效果更加稀疏。这些年来随着压缩感知理论的提出,使得更多的人研究稀疏表示,稀疏表示领域更加火热。基于过完备字典的稀疏表示,现在主要考虑的有两个方面,一个是怎么选择字典,使得字典能较好的符合图像信号特征;二是如何选择比较有效的快速的稀疏表示算法,能更好更快的完成稀疏表示。有了以上两方面的考虑,下面就是把稀疏模型应用到图像处理的具体方面。对于这点现在国内外学者已经做了一定的研究。字典的发展从开始的正交基到冗余的正交基,然后再到超完备字典,体现了向冗余发展的趋势,因为字典的这种冗余特点能更好的稀疏表示图像信号,同时对噪声与误差也更加鲁棒,所以当前的字典选择的前提都是过完备的字典。字典的选择主要有以下几种方式:首先是使用现有的正交基等方法作为字典,选择这种字典虽然具有快速变换和逆变换的特点,却不能完全有效的稀疏表示图像信号。其次的方法是通过联合正交基来构成字典,这种字典应满足类内稀疏的特点和类间强不相干性,这样可符合图像信号中不同形态的局部结构,从而达到更加稀疏表示信号的愿望。具有自适应性的方法通过学习的原理训练给定的字典,使得字典能更好的符合图像信号结构等,像K-SVD算法[21]、CNDL-FOCUSS算法[22,23]、OnlineLearning算法[24]等,本文应用到的就是K-SVD算法进行字典训练。字典选择后,就要选择有效的稀疏分解算法得到图像信号的稀疏表示,信号的稀疏表示算法最早要追溯到1982年的投影追踪算法的提出。当前解决这个问题的稀疏表示算法主要有以下三大类方法:1.松弛优化方法。该方法的主要原理就是将原先的0-范数问题替换为凸的问题来解决,因为0-范数问题是非凸的,这样可以有效的简化问题解决难度,降低原先算法的复杂度。其中目前主要的松弛优化算法主要为基追踪方法[12]、Focuss方法[25]、迭代收缩方法[26-28]、GPSR方法[29]。但是该类方法比较依赖过完备字典本身的结构,对于普通的冗余字典,该方法的复杂度比较大,在实际应用中效果并不是很好。2.贪婪跟踪方法。该方法的主要原理每次迭代过程根据一定的原则逐次从字典中选择用于进行稀疏表示信号的原子,经过迭代过程的完成,可以得到图像信号的稀疏表示。这种方法比着上述的松弛优化的方法明显的优点就是降低运算的复杂度。基于匹配跟踪方法国内外的学者提出了很多的改进方法,比如正交匹配追踪方法[30-31]、高分辨率匹配追踪方法[32]、梯度追踪方法[33]、StOMP方法[34]等。3.组合优化方法。比如其中的采用割平面法[35]和GroupTesting[36]完全搜索解的空间,然后根据一定的准则减小搜索范围,用来降低运算的复杂度。但是这种方法具有比较大的局限性,只适合尺度比较小的信号问题。为了解决这个问题,后来的智能计算方法就提出新的解决思路。由于稀疏表示的诱人前景,国内外的学者把稀疏表示应用到图像的处理领域,如人脸识别[37]、图像去噪[38]、图像分割[39,40]、图像压缩[41]。这只是研究的开始,随着社会的发展和科技的进步,关于图像的稀疏表示研究将会更加的完善。不仅是图像处理方面,在未来几年稀疏表示很可能会在编码、谱估计遥感探测等方面发挥着巨大的作用。1.3论文的研究内容及架构安排本文的主要研究内容是基于冗余字典的图像稀疏表示,其内容安排如下:第一章为绪论部分,首先介绍本文的研究背景和意义,简单介绍稀疏表示的基本概念和原理,然后介绍当前国内外稀疏表示的研究框架,字典构造,算法研究,最后引出本文的主要研究内容。第二章详细介绍了信号的稀疏逼近及其重构,以及介绍了重构算法中应用到的几种追踪算法:匹配跟踪算法、正交匹配跟踪算法和基追踪算法,然后引入到图像中的稀疏表示。第三章把贝叶斯重构思想引入到图像处理中来,把不容易处理的整幅图像分块处理,实现对任意尺寸的图像进行快速有效的处理的目的。第四章引用K-SVD字典训练算法的思想,在图像处理中基于噪声图像本身训练字典使字典能更好的适应去噪图像,取得了很好的效果。第五章参照压缩感知结构,应用一种新的结构构造思想,就是对原先字典中的原子由一个基字典进行稀疏表示。由对CT图像去噪的实验结果可知这种算法同时具有自适应性和有效性,处理大字典和高维数据效果不错。第六章总结本论文的工作,对稀疏表示的前景做出展望,并提出进一步的研究方向。第二章图像信号的稀疏表示2.1引言近年来,基于超完备字典理论的基础之上,学者通过构造超完备字典使字典能更加有效的适应信号,自适应的去稀疏表示图像,因为应用的超完备的字典的优良的视觉特效,因此基于冗余字典的稀疏表示能更有效的表示图像。2.2信号的稀疏逼近信号稀疏分解理论的思想是:用过完备字典取代基函数,字典尽可能好地符合被稀疏逼近信号的结构,可以任意的去构造字典,字典中的元素称为原子。基于字典中找到最佳线性组合的多个原子来表示一个信号,称作信号的稀疏逼近或者高度非线性逼近。N给定一个集合D???gk,k??1,2,...K?其元素是张成整个Hilbert空间H??R的单位矢量,K??N,称集合D为原子库,称呼其元素为原子。对于任意属于该空间的信号f??H,可以在原子库中自适应地选取l个原子对信号f进行分解:fl????c??g????Il(2-1)其中,Il是g???的下标集,l称为稀疏度。则可以由得到的l个原子在原子库D中张成的最佳子集:B??span??gk,????Il?(2-2)定义逼近误差:??l??f,D????infflf??fl(2-3)由于l远小于该空间的维数N,这种逼近被称作稀疏逼近。显然信号稀疏逼近的问题即为寻找式(2-1)的最稀疏表达形式:鉴于原子库的冗余性(K??N),矢量g??之间不再是线)有多种解答方案,但是的目的就是在满足逼近误差的前提下,能够找到最稀疏的表示信号的组合,换一种说法就是用最少的表示系数来表示信号,也就是l最小。为达到以上的目的,就要注意一些特别的原子库,其中呢,就是非相干的原子库吸引了大部分的研究人员,这种原子库意味着相干系数小于某个常数。下面是相干系数的定义:??supi,j,i??jgi,gj(2-4)明显相干系数大,原子之间的关系也就大。如果原子库中至少包含两个相同的原子,那么????1。反过来说,当??比较小的情况,就认为原子库是非相干的,原子之间相干系数为零。这说明,虽然原子库有可能是超完备的,但是在相干系数完全充分小,该原子库可能近似认为是一个正交原子库。2.3信号的稀疏分解上世纪90年代初期,人们为了对信号进行稀疏表示,首先应用匹配追踪方法取代以前框架的方法。很快人们便在实验中发现,假如信号在原子库中有非常稀疏的扩展,并且字典由三角函数和Dirac函数组成的字典,那么通过基追踪算法,这个稀疏表示就可以得到完全的重构。下面就介绍关于信号重构的跟踪算法。基追踪求解最稀疏的信号表示,也就是解决下列问题:min?0s.t.y??D?(2-5)明显的求解以上问题是一个NP难问题。根据1-范数和0-范数在某些条件下的等价性,因此可以将以上问题转化为求解下面问题:min??1s.t.y??D?(2-6)这样就将?0范数问题转变为求解?1范数,因此称为基追踪(BasisPursuit,BP)。解决这个问题可以通过线性规划的方法来解决。mincTss.t.ws??b,s??0(2-7)通过下面的变换可以将基追踪问题转化为线p;s??(u,v);c??(1,1);w??(??A,A);b??x(2-8)这样就能通过线性规划问题解决基追踪问题。假设w为n??m的矩阵,其中m??n。BP算法得到一个基,该基的每一列是使信号取最佳值的非零列向量,而矩阵w的列就是由这些非零系数组成的,这就组成一个Rn的基,因此上述问题就可以得到唯一的解。普遍情况下,可以用任意线性规划问题解决基追踪问题,BP-simplex和内点法[42]是比较典型的算法。匹配跟踪尽管使用了线性规划的方法解决,基追踪方法由于要在所有的原子库向量的不同组合寻求满足算式(2-6)成立的极小化??1的解,计算量消耗代价太大,因此人们希望采用能够求解局部最优的贪婪算法取代求??0的全局最优,以减少计算的复杂性。匹配跟踪(MatchingPursuit)算法是是一个迭代算法,在每一次的迭代过程中,从原子库里选择最能匹配信号结构的一个原子而构建的一种逼近过程。在统计学中,匹配追踪算法被称为投影跟踪(ProjectionPursuit)[43,44]。在逼近学的领域,被称为纯贪婪算法(PureGreedyAlgorithm)[45]。假设字典D中的所有原子的范数都为1,算法初始化,设R0f号首先分解为:??f,可以将信R0f????gr0,R0f??gr0??R1f(2-9)r其中??g0r,R0f??g0是R0f对gr0的投影,R1f是剩余量,显然gr0与R1f是正交的,因此可以得到下列式子:rR0f2???g0,R0f??2??R1f2(2-10)r为了想最小化R1f的能量,就需让投影值??g0的步骤对剩余量进行操作,设定,R0f??极大化,然后简单的实施同样r??gs,Rsf????sup??grsr??,Rsf??(2-11)fs?1?fs?g,Rs?1fg??s?1s?1(2-12)Rs?1f??f??fs?1(2-13)那么到第M步,剩余量的逼近误差(范数)满足:M?1RMf2?f2??s?0??grs,Rsf??(2-14)对于无限维空间的字典,(2-11)中的上确界并不确定能达到,所以可以考虑下面的r式子使的??gs,Rsf??约等于最优:r??gs,Rsf??????sup??grsr??,Rsf??,0??????1(2-15)这种算法称为弱匹配追踪(WeakMatchingPursuit)[46],其中????(0,1]是其中的一个最优因子。匹配追踪算法因为其中的投影不是正交的所以,所以使该算法有个缺点:就是在已经选定的原子空间上,对于信号的稀疏表示不一定是最好最优的。通过该算法的步骤和原理还可以看到,匹配追踪算法计算量非常大,因为该算法在每一步的过程中都要完成信号或信号分解残余在每一个原子的投影计算,在高维空间r上都要进行每一次的内积计算??gs,Rsf??,并且不止进行一次,因此对计算量有很高的需求,学者们为了弥补这个缺点提出很多的改进算法[47-50]。2.3.3正交匹配跟踪由于匹配追踪的缺点,在MP的基础上,Y.C.Pati提出正交匹配追踪算法(OrthogonalMatchingPursuit)[31],该算法在利用Gram-Schmidt正交化方法递归地对所选原子进行正交化,然后将信号投影到这些正交原子构成的空间上,因此得到信号在各个已选原子上的分量和残余分量,然后用类似匹配追踪的方法分解残余分量。经过S次分解后,原信号被分解为S个原子的线性组合。在每一步分解中,原子都要满足相应的条件才能被选为最佳原子,因此残余分量会随着分解快速变小,这样的话就用少量原子的组合就可以表示原始信号,并且经过有限次迭代就可以收敛。?由于匹配追踪算法挑出的原子g并不一定和前面已挑选出来的原子s{g??p}正交,使得当减去Rsf在g??p?s0?s的投影的情况下,匹配追踪算法将在{g??p}0??p?s的方向上重新引进新的成分,这个问题可以通过将余项投影到从{g??p}0??p?s计算得到的正交族{up}0??p?m上来避免,正交匹配追踪算法具体如下:令u0??g??0,对于s??0,OMP从字典中挑选原子g,使?sr??gs,Rsf??????sup??grsr??,Rsf??(2-16)利用Gram-Schmidt正交化方法将g关于{g}正交化,设rss?1??p0??p?sus??g?s?????grs,up?up(2-17)p?0将us进行归一化处理:ps??usrs?ps(2-18)(2-19)uss将余项Rsf投影到u上,得到????usus(2-20)ss,s?1Rf???Rfus?us??Rf(2-21)在0??s??k范围内求和得到k?1?ssVkf??Rsf,u?us?0?Rkf??Pf??Rkf(2-22)上式中P是在{u}所生成的空间V的正交投影算子,Gram-Schmidt正交化方Vks0?s?kkk法确保{g}0也是V上的一组基,对于任意k??0,余项Rf是f正交于V的部??s?s?kkk分,对于s??k,由(2-17)可得sr?Rsf,u?????Rsf,gs?(2-23)假设经过M次逼近过程,因为Vk的维数为K,故存在M使f?VM,从而RMf??0,将(2-23)代入(2-22),同时令k??M,可得M?1rsf?????Rsf,gs?0?us(2-24)经过有限的M次的迭代过程后可以到达收敛,上式的能量为:M?1f2??s?0?Rsf,grs??2(2-25)以上就是OMP算法的基本步骤,在每次的迭代中,该算法选择与当前信号残余最相关的原子。只要选定该原子,则将正交投影到已选原子所张成的空间,然后在重新计算原子系数并且更新参与误差,重复以上步骤,直到达到所设置的算法的终止条件为止。采取正交化使MP算法的收敛性得到明显改善,收敛速率也加快。因为是经过有限次的迭代后算法收敛,使OMP算法更能稀疏的表示信号。以上两种算法都是每一次迭代过程中只从字典中选取一个原子,如果一次选择多个原子,则可能大大提高效率。基于这个方面的考虑,Donoho提出每次选择多个原子的StOMP算法[34],算法思想是每次迭代选择所有的残差内积所有与残差内积系数幅度大于设定阈值的原子,随后计算当前残差信号与所有选择原子的最小二乘逼近,将逼近误差作为新的残差,如上所说迭代下去,直至满足给定的终止条件。因此StOMP算法再一步降低MP算法的复杂度,使该算法得到广泛的应用。2.3.4过完备不相干级联原子库在N维的有限空间里面,两个正交基级联的原子库,相干系数???1,如果N两个正交基共同含有一个公共原子,那么它们的相干系数????1。所以,由正交基级联而成的原子库如果相干系数为????1/N的话,可以认为这个级联的原子库不相干的。Dirac函数和三角函数是两类最基本的正交基函数,任意两个Dirac函数和三角函数的点积为????1/N,所以将这两个基联合在一起构成一个级联字典,这个级联字典的相干系数是????1/N。由这一对正交基联合而成的不相干级联字典,是最早被证明可以准确重构信号的。但是还有一些由另外的对不相干的正交基级联字典的例子,其中就包括基于L2(0,1)空间上的Haar和Walsh函数[51,52]。2.4图像的稀疏表示可以把图像看作是一种二维信号,因此对于图像的稀疏表示可以应用以前信号的稀疏表示理论和方法进行操作。知道一幅图像可以定义为一个二维函数f??x,y??,x和y是是其函数空间坐标,而函数值f称为像素点(x,y)的强度或者灰度值。当x,y和幅值f为有限的、离散的数值时,称该图像为数字图像。现在假设研究的图像为f,其大小M1??M2,M1和M2为图像像素的行数和列数。如果在完备正交基上进行图像分解,那么这组基的数目为M1??M2。因为基是正交基,使得基在又图像构成的空间是稀疏分布的,这样的结果会照成进行图像分解后图像的能量会比较分散的分布在不同的基上。这种能量的分布使得不能简洁的用基的组合表示图像,那么也不是稀疏的表示图像。为了有效的稀疏表示图像,基的构造在空间内应该是尽量的密,因此这里就称基为原子。图像在过完备字典上的分解一定是稀疏的。?????设D???g????为用于图像稀疏表示的过完备字典,g???为定义的原子,用不同方法构造字典,参数组??中含有的参数类型以及参数个数也都不相同。原子g???的大小与图像本身大小相同,在进行稀疏表示之前应该对原子进行归一化,即g???????1。??为参数组??的集合。由字典的过完备性可以知道,参数组??的个数必须?????远大于图像的大小。即若用P表示过完备库D???g????中原子的个数,则:P远大于M1??M2。设定好合适的原子库和原子参数后,下一步便是怎么用这个原子库中的原子去稀疏表示输入的图像[53]。这就要应用到上面介绍的稀疏分解的跟踪算法,和信号的稀疏分解一样,把整个图像M1??M2作为信号去用前面介绍的跟踪算法进行稀疏分解。2.5本章小结本章主要是介绍信号的稀疏表示原理,以及当应用到对图像进行稀疏分解的大概步骤。本章的信号稀疏分解算法主要是基于过完备原子库的,也就是冗余字典,这样可以克服传统正交基的很多缺点,可以使信号便于处理,并且可以使很多原来NP难的问题都得到解决在稀疏分解算法中,目前常用的算法主要有MP,BP,OMP等,每种算法都有其各自的优缺点,并且简单介绍关于把信号稀疏分解应用到图像稀疏分解方面的知识。第三章基于冗余字典的图像滑窗分块稀疏表示去噪3.1图像去噪3.1.1去噪问题描述假设原始图像x被噪声v污染,污染后图像为y,这里设噪声为高斯白噪声,因为v与原始图像x不相干,可以由其均值??和标准差??度量,则y可以有下式(3-1)表示:y??x??v(3-1)去噪可以理解为由已知图像y推测原始图像x的过程,尽量从y中把噪声去除掉,使处理后的图像能尽量接近原始图像x。3.1.2噪声模型由文献[1]可知数字图像的噪声主要来源于图像的获取(数字化过程)和传输过程。图像传感器的工作情况受各种因素的影响,如图像获取中的环境条件和传感器元器件自身的质量。图像在传输过程中主要是由于所用的传输信道的干扰受到的噪声污染。比如,通过无线网络传输的图像可能因为光或者其他大气因素的干扰被污染。主要的噪声模型如下:高斯噪声:许多复杂的因素综合在一起作用,一般理解为大量的、幅度很小的独立等分布的因素进行叠加,最终合成的效果,根据中心极限定理,可以用高斯分布进行统计描述。高斯分布的形式为z~N??,??2???1??????z?????2?exp?(3-2)??2????2??2??其中z表示灰度值,??表示z的平均值或期望值,??表示z的标准差,标准差的平方??2,称为z的方差。在采用这个模型时需要注意,虽然理论上噪声z取值范围无限制,但是在工程上可以把噪声的范围理解为?????3??,????3???。重尾分布噪声:许多场合下,比如产生噪声的原因并不互相独立,或者参与求和的项不是足够多等。在诸如此类的条件下,噪声只能粗略的确定为高斯模型。许多情况下,噪声分布的中心部分接近于高斯分布,但是在分布的尾部,即?y??zf??y?dy(3-3)随着z???的衰减比高斯分布情形要慢,把这类分布称作重尾分布。椒盐噪声(脉冲噪声):椒盐噪声描述的是图像双极型噪声。只有个别像素上有噪声,但是这些噪声的效应不同于以往的简单加性噪声。若把原图像像素记为x,椒盐噪声记为z,而被椒盐噪声腐蚀的图像像素记为y,则可以直接对y来描述椒盐噪声的效果???,?p??y???????,????,y??xy??ay??b(3-4)这里????????????1。需要注意理解这个模型与以往的噪声模型显著不同:通常的模型是直接对噪声进行刻画,而这里是对受椒盐噪声污染后的图像进行统计描述。出现椒盐噪声的像素,带噪声的图像的像素只会出现两种值:a和b。还有对于近似偏移的直方图十分适用的瑞利噪声,伽马噪声,均匀分布噪声及指数分布噪声等,在这里就不详细讲述。3.1.3去噪效果评价图像质量的含义主要有两个方面,一方面是图像的逼真度,另一方面是图像的可懂度。图像的逼真度指得到的结果图像与原始图像的偏离程度;图像的可懂度指的是图像向人或机器提供信息的能力。很多年以来,人们希望找到关于图像逼真度和可懂度的定量测量的办法,作为评价图像质量的依据,但是对于人类的视觉心理特性的描述和测量还没有找到比较好的方法,因此还是传统的图像质量评价方法。传统的图像质量评价方法包括主观评价和客观评价。主观评价主要依据人的视觉感官去评价图像的去噪效果,主要分为两种度量尺度:绝对评价和相对评价。绝对评价是评价者根据自己的经验和提前规定好的评价准则对图像进行质量评价。相对评价是评价者将好坏不同的图像进行分类然后对这些图像进行相互比较给出自己的评价结果。而客观评价方法经常用到的是计算图像的均方差(MeanSquaredError,MSE)和峰值信噪比(PeakSignaltoNoiseRatio,PSNR),以下就给出这两个测量尺度的公式定义:●均方误差:MSE?MN12???f???m,n????f?m,n?(3-5)MNm?1n?1●PSNR是以分贝(dB)为计算单位的2PSNR??10lg??Peak??dB?(3-6)MSE通常,在8位量化的灰度图像中,取Peak??255,这就给出通常的计算公式2552PSNR??10lgMSE?dB?(3-7)3.2基于冗余字典的图像分块稀疏表示去噪这些年来基于过完备字典信号稀疏表示理论得到海内外学者的广泛关注,并做出了一定的研究。该类方法的基本思想就是用过完备字典取代原先传统方法中的正交基,而对于字典应该尽量去选择包含要表示信号所包含的信息内容。信号的稀疏分解就是从冗余字典中选择能最优表示信号的若干原子的线性组合,实际上根据第二章所述它是一种逼近过程:f??fm??fr?????kdk??frk??m(3-8)其中:fm为f的逼近信号,fr为残余分量,dk为给定过完备字典D??RN?K的一个原子,??为稀疏系数矩阵。从稀疏角度来看,的目的就是基于残余分量最小的前提下得到稀疏系数??最稀疏的一个解。可以构造优化函数:min?0s.t.f???k??m?kdk???2(3-9)上式对于冗余字典来说,如何求取唯一解是一个典型的NP难问题。这就要用到上一章介绍到的跟踪算法,比如MP算法,OMP算法或者是BP算法,等等都可以比较好的解决上面的问题。正如2.4所介绍的稀疏表示在图像中的基本应用那r样MP算法是从过完备字典中选择与图像f内积最大的原子gk,此时相当于原子grk能最为匹配的表示图像信号-原始图像的有用信息。在图像f中减去最佳匹配原子grk,结果就得到的图像残差R1f,然后对R1f提取最佳匹配原子gr1,重复上面的计算过程,像这样不断的迭代下去,提取出来的图像内容越来越多,同时相反的图像的残差则越来越小,分解到相应的程度后,可以近似的认为从图像中已经把有用信息提取出来,此时剩下的残余就是噪声。此时得到对噪声图像进行跟踪算法后得到稀疏表示的系数矩阵,然后由系数矩阵和冗余字典得到去噪后的图像,这就是基本的利用字典和稀疏表示对图像进行去噪的基本原理和过程。至于要应用冗余字典的原因就是通过过完备字典对信号进行稀疏分解,而选取的其中的原子能自适应的根据信号本身的特点选择表示的方法和结果,这样可以得到对信号最稀疏简洁的表示。稀疏分解表示一方面可以高效率的进行数据压缩,更重要的是能够基于过完备字典的冗余特性捕捉原始信号的自然特征。当应用到实际图像处理的情况需要考虑的因素很多:1.本身稀疏分解对于图像处理速度就比较慢,比如当图像比较大的环境下,用大字典来进行稀疏表示就有好多的缺点和不足,运行效率低,运行时间长,意思就是说能不能设计一种途径使该方法适合任意尺寸大小的图像?2.还有对冗余字典的训练选择上也是很重要的,因为过完备字典是实现信号稀疏表示的重要前提,如何构造过完备字典是重要的研究内容,目的就是使构造和训练的字典能更好的稀疏表示信号。参照文献[54],基于上面提出的疑问,本文应用基于图像块图像稀疏表示去噪处理方法。图像取块1、图像块的稀疏模型对于图像,取大小为n??n的图像块,对块拉成列向量x??Rn,对于这种图像块模型,定义字典D??Rn?k(K大于n说明字典是冗余的),此时假设D是固定和已知的,并且对于每个图像块x,字典D都能稀疏的表示。解决的式子为:????argmin??subjecttoD????x0(3-10)要是达到稀疏的要求,必须使?n。?代表的是??向量中非零元素的个数。00对于加入标准差为??的高斯白噪声的噪声图像,应用最大后验概率估计[55](MAP)和MRF理论,上式(3-6)变为????argmin??0s.ty-D??2???2(3-11)这个公式就是用来对图像进行去噪的解决方案。而通过计算x???D??就可以得到去噪后的图像。可以把以上的优化问题变为:????argminy-D??2?2?????0(3-12)此时就变成罚函数。对于合适的??,(3-11)式和(3-12)式是等价的。而解决以上的优化问题很难准确的去求解。而匹配追踪算法或者BP算法都能得到很不错的逼近结果。本文中应用到的是正交匹配跟踪算法,相比较匹配跟踪算法(MP),OMP算法是对匹配跟踪算法的一种改进。该算法选取最佳原子的方法和匹配跟踪算法是相同的,都是从字典中选择最能匹配信号的原子。而两种算法的差别是,OMP算法要将所选原子递归的进行正交化处理。因为一般处理的图像都是那种尺寸比较大的图像,做好处理块与整幅图像之间的关系是去噪的关键。而为了避免产生块效应,对图像可以重叠取块。当图像变大,为了减少机器的存储压力和加快运行速度可以加大取块的移动距离。块到整体上面说到是对于很小的图像块的情况考虑,对于N??N(N远大于n)的大图像,如果还要用以上的稀疏模型来操作,必须创建更大尺寸的字典。如果对于大图像还是坚持用以上固定的小尺寸字典,而处理的结果具有局部特性,怎样处理局部到整体的关系就显得尤为重要。一种启发的方法就是在图像块上进行处理,然后覆盖结果,这种方法会产生边界影响。可以对重叠的图像块进行处理然后对这些结果进行平均,这样可以防止产生边界影响,为了避免块效应,取块时相邻的块与块之间要有重叠的像素。因此对于未知的大图像X,取的块都满足稀疏模型,因此上述的(3-12)式MAP估计可以被下式取代0???,X?????argmin?2X??Y???????2D?????RX(3-13)ij?2??ijij?ijij2ij,Xijij上面式子右边第一项决定噪声图像和去噪后图像(未知的)的相似程度。设定一个常数p,那么这个惩罚函数可以理解为X??Y2??p.??2,那么这就反映??和??之2间的直接关系。第二项和第三项是图像的先验知识,确保在构造图像X中,每个大小为n?n的图像块xij??RijX都有一个具有边界误差的稀疏表示。矩阵Rij是一个n??N的图像取块的索引矩阵,Rij表示从图像中取第(x,j)图像块。对于N??N的图像X,总共会有(N?n?1)2个索引,此时是在完全重叠的情况下考虑到所有n?n大小的图像块,相当于块的移动距离为一个像素。而对于系数?ij必须遵从D?ij??RijX2的约束限制。2数值解决假设字典D是已知的,此时对于(3-9)式有两个未知量,一个是每个块的稀疏表示?ij,另一个是整体的输出去噪图像X。为了使这两个量的优化不同时进行,采取初始化X??Y,然后寻取最佳的?ij。因此就把最小化任务去耦合为许多小的任务,下式(3-9)代表一个图像块的最小化任务形式。下面的(3-14)每次在一个图像块上运行。??ij??argmin?ij?2??D?ij??xij(3-14)?02用正交匹配跟踪(OMP)能很容易的解决上述问题,一次采集一个原子。当残差2D?ij??xij小于T的情况就停止稀疏表示。对于这种方法,?ij的选择是非常简单2的。因此这个步骤可以称为滑窗稀疏编码,一次对一个块n????n进行一次稀疏编码。当得到所有的??ij后,这些??ij固定不变,然后就需要来更新X,对应式(3-13)需要解决X???argmin?XX??Y22???ij2RijX??D??ij2(3-15)这是简单的二次项,它的解决方法为?1??????^?X??????I????RijRij???????Y????RijD??ij?(3-16)T?ij?????Tij?这就是得到最后去噪图像的求解表达式。字典选择为了能使字典更好的适应图像,能有效的稀疏表示图像,从类似的图像样本集选取图像块训练字典。3.3实验及其分析(a)过完备DCT字典(b)由大量自然图像样本训练的字典图3.1实验中两种方法的字典比较在5个如图3.2所示测试图像上用图3.1所示的两种字典的方法去噪进行实验。字典大小设置为64??256,图像块选择为8??8像素(n??64,与原子的大小一致),边界点不考虑。图3.1显示的是过完备DCT字典和通过训练样本得到的字典的描述,为了更形象观察原子,把字典中的每个原子当成8??8的像素显示。在所有的实验中,去噪的过程包含对每个来自噪声图像8??8像素图像块的稀疏编码。应用正交匹配跟踪算法(OMP),当平均误差达到阈值是计算停止,这里的误差限制选取经验值为????1.15???。图3.1是实验中所应用的两种字典,左边的是冗余离散余弦变换字典,右图是基于自然图像样本训练的字典,每个原子用8??8的像素块表示。训练的图像块来源于大量不同类型的无噪声自然图像的图像块。实验过程中设置平均图像块到整幅图像中的参数????30/??,对于式(3-12)只进行一次迭代,因为对于接下的迭代运算,需要知道新的参数噪声??,但是在改变图像X后这个参数??就是未知的。2×512Lena图像(b)256×256Peppers图像(c)512×512Boat图像(d)512×512Barbara图像(e)256×256House图像图3.2测试图像对五幅图像进行加入高斯白噪声??分别为10、20、25、50、75的实验。以上表3.1是对每幅图像在加某个噪声用这两种方法做3次实验的平均结果。为了能够比较分析稀疏表示和小波的结果,表3.1中也附上文献[54]中的小波结果。通过表3.1可以看出,基于样本训练字典的方法比着直接用过完备DCT字典去噪方的方法的效果好的多,特别是在House图像和Peppers图像去噪方面效果更加明显,像在噪声??=25时Peppers图像的处理结果中,两种方法居然相差达到0.83dB。这说明House图像和Peppers图像具有典型的自然图像的一般特征,用经过大量样本训练的字典很好的适应这两幅图像的特征。表3.1去噪结果PSNR的总结(过完备DCT字典去噪记为ODCTdenoise,本文自然图像样本训练字典去噪记为exampledenoise,小波方法记为waveletdenoise,以下类似标记,去噪结果单位dB)噪声?1020255075BarbaraODCTdenoise33.9429.9528.6524.7722.79exampledenoise33.0628.8927.5724.0822.48waveletdenoise34.0330.3229.1325.4823.65BoatODCTdenoise33.4429.9328.7625.6023.84exampledenoise33.5330.2629.1425.9424.03waveletdenoise33.5830.3829.3726.3824.79LenaODCTdenoise35.3332.0130.8427.5025.61exampledenoise35.4332.3031.2027.8325.81waveletdenoise35.6132.6631.6928.6126.84HouseODCTdenoise35.3932.0830.9327.3625.12exampledenoise35.6632.7931.7327.8625.32waveletdenoise35.3532.3931.4028.2626.41PeppersODCTdenoise33.9330.2229.0625.2723.13exampledenoise34.3430.9429.8726.1323.78waveletdenoise33.7730.3129.8025.9024.00通过表3.1中知,对于Barbara图像,因为该图像含有高频的纹理特征,而本章的方法是对于自然图像样本图像块训练字典,能适应大部分的自然图像,代表着自然灰度图像的一般特征,而Barbara图像因为纹理丰富,而纹理则意味着高频特征。众所周知图像中的噪声一般是高频成分,图像信息是低频成分,那么应用基于样本训练字典的方法在去除真正的高频噪声的情况,也把部分的高频纹理信息作为噪声去除,因此这种方法在去除Barbara图像噪声的效果比较差。而对于过完备DCT字典,通过观察图3.1可以看出,过完备DCT字典能较优的表示周期信号,因此可以对纹理较丰富的Barbara图像能获得较好的去噪效果,但是对Lena和Boat图像的去噪效果则相对较差些。通过表3.1三种方法的去噪结果可以看出,对于Barbara、Boat和Lena三幅图像,文献[54]的结果是三种方法之中最好的,而基于样本训练字典的方法由于训练内容与测试内容之间的关系问题,在这三幅图像表现并不好,甚至在某些图像上的去噪效果很差,就像对于Barbara图像,该方法比着文献[54]的方法PSNR差很多,达到1.6dB之多。可以想见该方法还是有一定的局限性和缺点。但是从视觉效果上来看还是不错的,通过图3.3中可以观察出,虽然本方法PSNR最低,但是在去噪效果上还是最好的,对图像的纹理信息恢复的比较好。(a)原始图像(b)噪声图像PSNR=20.1793dB(c)ODCTdenoisePSNR=28.6769dB(d)exampledenoisePSNR=27.5899dB图3.3Barbara图像的去噪结果??=25图3.3和图3.4分别列出的是在噪声??=25的情况下,Barbara图像和Peppers图像的去噪结果(去噪方法标记名字和表3.1一样)。(a)原始图像(b)噪声图像PSNR=20.2683dB(c)ODCTdenoisePSNR=29.0565dB(d)exampledenoisePSNR=29.8794dB图3.4Peppers图像的去噪结果??=253.4本章小结本章基于贝叶斯重构,应用一种分块的思想,通过对图像分块建模,使小尺寸的字典可以得到良好的应用,提高图像去噪的运算效率和灵活性。该方法首先对图像块构造稀疏模型,应用贝叶斯重构思想,把图像分块进行处理,对图像块进行稀疏表示,然后把所有的块处理后的结果整合得到整幅图像的处理结果。因为是分块处理的,因此该方法可以对任意尺寸大小的图像进行处理。为了使字典能更好的适应图像,选取的字典是经过大量的类似图像的训练后的字典,能更好的反应图像内容。针对图像稀疏分解速度慢的问题,本文提出将图像块,以图像块作为稀疏表示研究对象,有效提高基于稀疏表示理论的图像处理速度。第四章基于字典学习的自适应稀疏表示去噪4.1引言由上一章的实验结果得到,由大量样本图像训练的字典的去噪性能还不是很完善,那能不能有一种可以基于噪声图像本身作为训练对象的方法呢?本章就是基于这个思想,应用K-SVD算法来训练字典,使训练后的字典能更好的适应图像。4.2字典训练在图像稀疏表示的应用中,字典的选择是一个很重要的环节。一般为了使匹配跟踪分解能适应各种不同的信号,通常要求原子字典是高度冗余的。根据应用需求,字典的构造实际并没有硬性限制,可以是窗函数经过结构化的调制变化得到,可以是任意一个随机信号空间,也可以是精心设计的结构化字典空间,本章就是选择一种自适应的方法训练字典。4.2.1奇异值分解奇异值分解[56-58](SingularValueDecomposition,SVD)最早是由Beltrami在1873年提出的。奇异值分解的定义如下:设A??Rm?n,其特征值满足则称????1???2???3????r???r?1???n??0?i(i??1,2,?n)为A的奇异值。(4-1)定义矩阵的奇异值分解后就可以定义SVD,设矩阵A??Rm?n,那么存在着正交矩阵U??Rm?m和正交矩阵V??Rn?n,使得下式成立?M0?UAV???????S??00?(4-2)式(4-2)中M??diag(?1,??2,?,??p),p??min(m,n),因为U和V都是正交矩阵,所以可以得到下式:A??UAVT(4-3)上式就是矩阵A的奇异值分解,S是A的奇异值矩阵。奇异值分解具有以下性质:1.具有良好的扰动稳定性。这个特点也就说明奇异值作为一种特征值,它对噪声、污染等引起的变化具有不敏感的特性,换句话说奇异值具有不错的稳定性。2.比例不变性。3.旋转不变性。该性质说明对矩阵做旋转运算和置换运算,矩阵的奇异值特征是不发生改变的。奇异值的比例不变性跟旋转不变性特点使奇异值分解很好的应用到图像旋转、镜像、平移、放大、缩小等方面。4.降维特性。若A??Rm?n,能通过奇异值分解表示成m??n个r维向量。若A的秩r远远小于m和n,可以计算出r?mnm??n?1,所以通过奇异值分解可以达到降维的目的,同时降低对计算机存储的高要求。5、奇异值分解比较容易得到关于矩阵A的秩为k??r的一个最佳逼近矩阵。基于这个特征可以对信号进行分解和重构,提取信号中的有用信息,消除噪声等。由于以上几点奇异值分解的性质,将奇异值分解应用于字典训练的过程是可行而且是有效的。4.2.2稀疏表示与聚类研究者们对于稀疏表示与聚类间的关系也有很大的兴趣[59,60]。在聚类应用中,kk?1可以通过学习训练得到一系列的基向量?d?K,而聚类中的每个样本都必须通过这些基向量中的某一个来表示的(使用l2准则来测量距离)。因此可以认为这种聚类其实是一种稀疏表示,只是这种稀疏表示用一个原子就可以表示,使得稀疏系数为1。根据前面几章的介绍知道,稀疏表示就是用最佳的几个原子的线性组合来逼近表示信号,这样的话稀疏表示可以认为是聚类问题的延伸。而其中的K均值算法是聚类问题中最常用的方法,因此就可以考虑从K均值方法可不可以得到什么启发或者启示。从框架来说,K均值算法可以概括为以下两步:kk?11、根据给定的聚类中心?d?K,然后将训练样本划分到与之距离最近的那一类中去;kk?12、基于得到的已聚好的类,然后更新聚类中心?d?K,让聚类的中心能更好的对样本进行新的聚类划分。而字典训练学习的方法也与以上的K均值算法相似,基本上都是以上的两步过程。首先基于初始化的字典找到表示信号的稀疏系数矩阵,然后在稀疏系数矩阵不变的情况下更新字典中的原子。而在这些字典学习的方法中的不一样的地方就是稀疏表示的方法选择和怎样更新字典原子的策略。下面介绍优化方向方法(MethodofOptimalDirections,MOD)[61]。这个方法与K均值算法很相像,先在稀疏编码过程用OMP算法,随后更新字典。该算法的主要的特点在于它的更新字典原子的方法非常简单有效。如果现在每一个样本的稀疏系数是已知的,定义误差ei??xi????i,则总体的误差如下式表示:222EF??[e1,e2,?,eN]F?X????F(4-4)其中,AF?????ijijA。2开始设定稀疏系数矩阵??是固定不变的,可然后更新字典??的原子使得能够减少上面的误差项。然后推导误差项,就能得到(X?????)??T成立??0,那就意味着下式T?(n?1)??X??(n)T??(??(n)??(n))?1(4-5)基于上式(4-5),就能够对字典原子进行更新。K-SVD字典训练算法最近,Elad等[21]提出一种新的训练字典的算法,称之为K-SVD算法。这种方法进行字典训练的过程是一个逐次迭代的过程,对于字典的更新是逐列进行的,并且字典的更新和稀疏系数的更新是同时进行的。这种算法可以有效地减少所需要用到的字典的原子数,并且训练后的原子还是能够线性表示初始字典的所有信息。本文提出将这种算法运用到图像去噪的字典训练来。该方法的具体的原理如下所示:和上一章的方法一样,对图形块进行操作。对于大量训练图像块,定义训练图像块矩阵为Y??[y1,....,yP],大小为n??P,其中n为训练图像小块的长度,P为训练图像小块的个数。首先考虑Y??[y1,....,yP]中任意一个训练图像小块yi,以及一个初始的随机字典D??,D??的大小为n??K,P远大于K并且K??n。对yi的稀疏表示可以表示为解下列优化问题:min??yi??D???2?2(4-6)s.t???T00其中??为稀疏表示系数,T0为稀疏度。首先考虑第一个阶段稀疏编码阶段,假定字典D??固定的,则上述优化问题可以表述为求解稀疏系数??。对于整幅输入图像Y的M个图像小块则可以表示为:?min?i公式进一步变形得到:ad等提出的K-SVD字典更新阶段为:在给定稀疏度T0的情况下,Y为输入训练图像,D??初始化为一个随机过完备字典,利用奇异值分解去更新D??的原子,最终求得训练后的字典。更新过程为:首先令d??为D??的第i列,??i为A的第i行,则假定更新其第k个iT原子。那么式(4-8)可以变形为:222K??2?Y??D??A??Y?d????j?Y?d????jd????k???E??d????k2jT????jT?kTkkT2(4-9)j?12?j?k?2i上式K为字典D??中原子的总数,而k为想要更新的第k个原子。令?i记录?yi??中使用原子d??的那些图像小块,即:kT?????{i1??i??K,??k?i????0}(4-10)k定义矩阵?大小为P???,其在??k?i?,i??处为1,其它地方全0。并令??k????k???,RTkkER??E?,对式(4-4)乘以?得到:kkkkFk2Rk2FEk?k??dkxT?k?Ek??dkxR(4-11)这时对ER进行奇异值分解得到:ER??U?VT,利用矩阵U的第一列为更新字kkk典中的第k个原子d???。然后应用V的第一列和?(1,1)的乘积作为稀疏系数矩阵中系R数向量xk。然后循环迭代最后达到更新训练字典的目的。K-SVD是训练字典的一种非常好的方法。综合以上介绍可以概括如图4.1,主要分为两个步骤:1、稀疏编码步骤。使用跟踪算法对信号进行稀疏分解。2、字典更新步骤。在这个步骤中,假设稀疏矩阵是已知的,然后应对残差数据矩阵用奇异值分解一次更新字典的信号应用的一列(原子),与此同时然后改变对应的稀疏表示系数。然后回到第一步稀疏编码,循环完成迭代次数。初始化字典稀疏编码更新字典循环输出训练字典和稀疏矩阵图4.1K-SVD算法框架4.3基于字典学习的自适应图像稀疏表示去噪前面基本的字典训练学习设计完成后,我们将在图像去噪中应用这种算法。上一章的去噪算法是基于字典D固定不变,即使是基于样本图像训练的字典。在去噪的过程中有很多的字典可供选择,不过相对于此我们可以探索:基于训练的基础上去选择更好的字典。因此本节用到的方法是用在噪声图像本身应用K-SVD算法训练字典去寻找更好的字典。4.3.1算法说明此时相当于字典D是不固定的,则最终的优化问题的求解形式如下???,X?,D?????argmin?2X??Y???????2D?????RX(4-12)ij?,D2??ijij?ijij20目标函数为:ij,Xijij2X???argmin?X??Y?D??2??RX(4-13)?ij,X,D2?i,ji,ji,j2根据上一章块的构造方法,假设有个固定的字典D和X,求解稀疏表示??i,j,这个步骤需要稀疏编码过程,应用的是正交匹配跟踪。给出这些稀疏表示后应用一系列的K-SVD操作来更新字典。但是当输出图像X得到更新后,会改变噪声方差,而这个噪声方差现在认为是已知的(在前面两个步骤中已经用到)。因此在得到最后的去噪图像X之前,用同样的噪声方差多迭代几次稀疏编码计算和字典更新步骤。具体过程见图4.2。X,D已知?ij对于每个块用跟踪算法计算稀疏因子迭代计算D,应用SVD,一次更新一列计算XD和稀疏?1??????^?TTX和稀疏因X?????I????RijRij???????Y????RijD??ij?子已知?ij?????ij?图4.2基于K-SVD算法的图像去噪框架由于对噪声图像本身进行训练的字典能更好的适应图像,根据稀疏分解的原理,稀疏分解时保留的图像的稀疏成分,那么在对字典进行训练更新后得到的字典能更好的反应图像特征,那么此时获得的稀疏分解重构的图像,能够达到更好的去噪效果。算法流程如图4.3所示,首先是对噪声图像进行分块处理。然后通过基于噪声图像块进行训练字典,初始化字典选择是冗余的离散余弦变换字典(这种字典效果好,并且能够减少运算的迭代次数),训练字典的方法选择K-SVD算法。然后用训练后的字典对每个块进行稀疏分解,最后对得到稀疏分解进行局部到整体的平均处理,最后得到去噪图像。噪声图像分块处理对噪声图像训练字典对块稀疏分解对块做平均处理去噪图像K-SVD图4.3去噪算法流程4.3.2实验及其分析2×512Lena图像(b)256×256Peppers图像(c)512×512Boat图像(d)512×512Barbara图像(e)256×256House图像图4.4测试图像为了与上一章的方法进行比较,也在5幅如图4.4所示测试图像上进行实验。字典大小设置为64??256,图像块选择为8??8像素(n??64,与原子的大小一致),边界点不考虑。为了更形象观察原子,把字典中的每个原子变换为n??64的像素显示。对以上五幅图像进行加入高斯白噪声??分别为10、20、25、50、75的实验,噪声增益选择1.15。以下表4.2是对每幅图像在加某个噪声做3次实验的平均结果。为了能够更直观比较结果,本章方法初始化字典为过完备DCT字典。表4.2去噪结果的PSNR的总结(过完备DCT字典去噪记为ODCTdenoise,自然图像样本训练字典去噪记为exampledenoise,小波方法记为waveletdenoise,自适应方法adapdenoise,去噪结果单位dB)噪声?1020255075BarbaraODCTdenoise33.9429.9528.6524.7722.79exampledenoise33.0628.8927.5724.0822.48waveletdenoise34.0330.3229.1325.4823.65adapdenoise34.3930.8029.6125.5022.98BoatODCTdenoise33.4429.9328.7625.6023.84exampledenoise33.5330.2629.1425.9424.03waveletdenoise33.5830.3829.3726.3824.79adapdenoise33.6430.3729.3025.9823.98LenaODCTdenoise35.3332.0130.8427.5025.61exampledenoise35.4332.3031.2027.8325.81waveletdenoise35.6132.6631.6928.6126.84adapdenoise35.5232.4131.3027.8525.80HouseODCTdenoise35.3932.0830.9327.3625.12exampledenoise35.6632.7931.7327.8625.32waveletdenoise35.3532.3931.4028.2626.41adapdenoise35.9733.1532.0827.8825.25PeppersODCTdenoise33.9330.2229.0625.2723.13exampledenoise34.3430.9429.8726.1323.78waveletdenoise33.7730.3129.8025.9024.00adapdenoise34.2930.8329.7526.1423.68通过表4.2的结果看到,在噪声??低于50,基于自适应训练字典的方法的去噪效果整体很好,而当噪声越来越大,该算法就会出现过拟合和自由度过大的问题,并且噪声很大的情况下基于噪声图像训练字典也没有多大的实际意义。对于Barbara图像,上一章知道基于样本训练字典的方法的效果并不好,因为Barbara图像的纹理比较丰富,而基于图像本身训练字典的方法能更好的适应去噪图像,能够学习到图像的具体的特征,就像裤子和桌布的纹理信息,因此能得到较好的结果,比着基于样本训练字典的方法有着极大的提高。当??分别为20和25的时候,该方法比着基于样本训练的方法高出2dB左右,可以想见该方法的优越性。由于该方法初始化字典为过完备DCT字典,但是字典随着图像的内容会更新自己,调整字典的内容,通过表4.2可以看出,相对于过完备字典去噪方法,因为其字典是不变的,对于信号稀疏表示就有很大的局限性,结果表明本章方法结果完全好于过完备DCT字典训练方法。(a)原始图像(b)噪声图像PSNR=10.6368dB(c)ODCTdenoisePSNR=22.7869dB(d)exampledenoisePSNR=22.4843dB(e)adapdenoisePSNR=22.978dB(f)经过训练后的字典图4.5Barbara图像的去噪结果??=75表4.3对字典尺寸的选择kODCTdenoise33.43dB33.47dB33.46dB33.40dBexampledenoise33.63dB33.70dB33.79dB33.78dBadapdenoise34.02dB34.21dB34.36dB34.40dB现在讨论下关于字典尺寸k选择的问题(原子个数)。为了能弄清楚字典的合适尺寸,通过对House图像分别取不同的尺寸进行去噪实验,为了去除??的影响,领其值为0,噪声方差??=15。通过表中的数据不难发现,当k??256或者512时PSNR能达到最大值,因此为了运算速率和效率问题,这里选择k??256。(a)原始图像(b)噪声图像PSNR=20.2683dB(c)ODCTdenoisePSNR=29.0565dB(d)exampledenoisePSNR=29.8794dB(e)adapdenoisePSNR=29.7955dB(f)训练后的字典图4.6Peppers图像的去噪结果??=254.4基于稀疏表示的SAR图像去噪前面都是对自然图像进行的实验,为了验证该方法的有效性,我们把这种方法应用到SAR图像去噪问题。对于SAR图像,因为其成像的机制问题,在获取SAR图像的过程不可避免的会受到相干斑噪声的干扰。因此,我们拿原始SAR图像来作为噪声图像来进行去噪处理,验证该算法的在SAR图像问题上的可行性。由于图像的相干斑噪声是乘性噪声,噪声模型如下面式子所示:y??xn(4-14)其中x是理想的无污染的图像,n为半点噪声,y是观测图像。把式(4-14)表示成下面的加性表示模式,y??x??x(n?1)(4-15)因此,不需要把SAR图像进行对数变换就可以转换成加性噪声模型来处理。v??x(n?1)(4-16)使用最多的衡量相干斑强度的参数是等效视数(EquivalentNumberofLooks,?ENL),等效视数ENL定义如下:ENL?I?????mean2std(4-17)对于计算ENL的区域问题,选取一均匀同质区域,这里同质区域是指地物特性相同的区域,通常指的是分布均匀的地物目标信息。mean代表同质区域的均值,std代表同质区域的标准差。在上面的实验方法中,噪声方差是作为先验知识,是作为已知的变量来进行去噪处理的。为了能够使用以上的方法,因此需要对SAR图像的噪声v进行估计方差。对于估计噪声的思想就是:用滤波的方法对SAR图像进行滤波去噪,然后应用得到的滤波后的图像,得到去除的噪声信息,然后用这个噪声信息去估计噪声方差。这里应用到的滤波方法是改进的sigma滤波[62]方法。因为该方法基于sigma滤波原理,改进了sigma滤波的以下几个缺点:抑制并且模糊亮目标,没有滤除极限情况下的暗目标,滤波的数据有误差。Albuquerque(b)Bedfordshire图4.7实验应用的两幅SAR图像实验中的实验图像为图

http://idiomcoach.com/zirongyu/58.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有