您好、欢迎来到现金彩票网!
当前位置:21点 > 字冗余 >

章信号的稀疏表示及过完备冗余字典的构造算法最大的特点就是更新

发布时间:2019-07-18 09:31 来源:未知 编辑:admin

  章信号的稀疏表示及过完备冗余字典的构造算法最大的特点就是更新字典的方法简单。假设信号的稀疏表示是已知的 我们定义信号与其稀疏表达式间的误差为 每一个信号都是矩阵 的一列 稀疏表示的系数向量 构成矩阵 忆表示 范数。假设稀疏系数矩阵 固定 我们可以以最小化 式为准则来更新字典 进行求导我们得到 字典就

  章信号的稀疏表示及过完备冗余字典的构造算法最大的特点就是更新字典的方法简单。假设信号的稀疏表示是已知的 我们定义信号与其稀疏表达式间的误差为 每一个信号都是矩阵 的一列 稀疏表示的系数向量 构成矩阵 忆表示 范数。假设稀疏系数矩阵 固定 我们可以以最小化 式为准则来更新字典 进行求导我们得到 字典就被更新了。因此在固定稀疏矩阵 的情况下 这种更新字典的方法简单有效 并且实际可行。 算法满足灵活性和简单性 但是在高效性上 由于 式是二阶的更新字典的公式 并且含有矩阵转置 此算法由于收敛速度慢 所以如果字典非常大 此算法在实际中几乎是不可行的。 小结本章首先介绍了信号稀疏表示的概念 在此基础上介绍了几种常用的实现信号稀疏表示的方法——基追踪、匹配追踪、正交匹配追踪等 然后介绍了信号稀疏表示的前提——过完备冗余字典的构造 并介绍了几种构造方法。信号稀疏表示打破了传统的信号压缩的瓶颈 减少了不必要的内存浪费 提高了压缩效率 因此展现了广阔的应用前景。 章基于稀疏表示的人的口型识别第章基于稀疏表示的人的口型识别在实际应用中 智能机器人的听觉系统检测到的语音信号往往是多个声源信号及噪音的集合 为了提高机器听觉系统的语音识别能力 我们可以在盲分离算法中融入视觉信息 提高语音信号的分离的效剁 】。这里所指的视觉信息 实际上是指口型信息 即根据人的口型来判断是否发出声音。信号的稀疏表示可以降低信号维数及冗余度 简洁高效地表示信号 由于人类的视觉系统具有对图像进行稀疏表示的特性 人类视觉系统可以在海量的信息中 有效地提取有用的信息特征 因此 可以将信号的稀疏表示方法用于模式识别领域。 口型图像特征的提取前面提到 特征大致可以分类四类 几何特征、灰度统计特征、代数特征和变换系数特征。其中 变换系数特征是指对图像进行各种数学变换 常用的有 变换、小波变换、 变换、离散余弦变换等 将得到的变换域的系数作为特征进行提取 这类方法计算方便 但是经过前面提到的常用的几种变换后 系数的维数仍然比较大。由于信号的稀疏表示具有很好的降维作用 所以将稀疏表示的方法用于提取口型的变换系数特征 可以很好地解决变换后系数维数大的问题。信号稀疏表示的前提和基础是具备一个正交展开基或过完备冗余字典 对信号的稀疏表示是在正交基或是字典上展开的。为了使口型图像更稀疏地、高效地表达 我们首先构造过完备冗余字典。在此 选用 方法进行过完备冗余字典的构造 由于字典是过完备的 故字典中原子的总个数要远大于信号长度 而字典是由训练集训练而成 所以原子总个数又要小于训练集中信号的个数。随后 将训练产生的字典里的原子 假设产生的原子个数为 分成两类——口闭和口张 闭着嘴巴的图像所训练出来的原子放在字典的前 这样经过重新排列后的原子组成的字典记为 。图像是二维的 对口型图像进行稀疏表示首先将口型图像按 扫描方式变成一个一维的列向量 然后在已建成的字典上将口型图像稀疏表示。如上 章基于稀疏表示的人的口型识别所述算法是目前进行信号稀疏表示的常用算法 但是 算法的一个明显的缺点就是在已选原子组成的子空间上 信号的扩展可能不是最佳的 因为它不是正交投影 由于信号在已选原子上集合上的这种投影的非正交性 使得 算法每次迭代的结果可能是次最优的 因此可能需要较多次的迭代才能获得收敛。而 算法对所选择的原子利用 正交化方法进行正交处理 以保证迭代的最优性 并且 算法在稀疏分解时所选择的原子更少 即信号表示更稀疏 在信号长度有限的情况下 算法往往难收敛而用 算法可在有限步长内达到收敛。所以 在过完备冗余字典构造完成的基础上 我们采用 方法对口型图像进行稀疏展开 其中为原信号 即口型图像 为残余 号稀疏表示的结果也可以表示为 其中 是过完备冗余字典 向量 是稀疏表示系数向量。口型图像进行稀疏展开后 假设得到的结果是 稀疏的 即只有 个系数非零 我们所提取的变换系数特征 即是图像稀疏表示后的系数 将这些非零系数提取出来作为口型图像的特征。 口型图像特征的分类和识别在本文的口型识别中 口型分为两大类——口闭和口张两类。假设原口型图像为 稀疏表示后的重构信号为 将两者之间的误差记为 所属的类。我们假设构造的字典原子总数为其中前 个是由口闭图像训练集所生成的原子库 即第一个子字典 个是由口张图像训练集所生成的原子库即第二个子字典。定义 为稀疏表示系数向量 对应的第 个原子库原子的系数保持不变而对应其余类的系数置零的向量 中对应的第个原子库原子的系数。将 作为的稀疏表示系数向量分别重构原图像 得出的结果分别记为 那么测试图像可以根据下面判决分类 显然若测试图像被判定为第一类 则口型识别结果为闭合的 反之 口型识别结果为张开的。综上所述 对于基于稀疏表示的人的口型识别 流程图如图 所示 具体步骤如下 输入 两类口型图像 信号 作为训练集 个数为甩个信号 测试图像 对训练集 中的信号预处理 或表示为定义 为稀疏表示系数向量 对应的第 类的系数保持不变而对应其余类的系数置零的向量 。对应的第个原子库原子的系数。由于本文中的口型分为两类 章基于稀疏表示的人的口型识别图本文算法流程图 实验仿真为了验证本文所提出的基于稀疏表示的人的口型识别技术的可行性和有效性 章基于稀疏表示的人的口型识别除了对本文算法进行实验仿真外分别选取了最近邻 法、最小距离 以及的基于稀疏表示分类 方法与之对比 所有仿真实验中 训练集是由 幅口闭图像和 幅口张图像构成的 测试集由 幅除训练集图像之外的口型图像构成 其中两类口型图像各占 以上实验均是在平台下实现的。 本文算法的仿真在本文提出的算法的实验中 首先对图像进行预处理 先对图像进行归一化处理 这样使得图像可以不受几何仿射变形的影响 找出图像中的那些不变量 我们主要通过对口型图像的归一化减小图像由于光线不均匀而造成的干扰 然后将训练集和测试集的图像统一变成大小为 的图片 随后按 扫描方式变成一个一维的列向量的形式 的向量经过预处理后 训练集的大小为 测试集的大小为 。第二步 方法训练字典设定生成的字典里的原子的个数为 每个原子的大小为故字典大小为 其中 个原子代表口张图像特征。本实验中在对测试集中的图像实现稀疏表示时 将稀疏表示设为 稀疏 即稀疏表示系数向量 大小为 中的元素只有 个是非零的 其余元素全为零。图 是输入一幅口型图像后 稀疏表示的结果 稀疏表示的人的型识别 ——二———————————————————————————————————————————一由于每幅口型图像稀疏表示后的系数向量的大小为 中的横坐标代表稀疏系数向量的行纵坐标代表稀疏系数的大小 具体结果如图 由上式可以看出系数向量 不为零的元素的行标 也就是其所选原子的序号 字典中的每一列为一个原子 进行分类识别后被分类到第一类 的结果用虚线画出分类到第二类 的结果用实线画出结果如图 所示 分别为两个模式类的测试图像为判决、识别后的 信号 虚线表示识别为第一类模式类 为判决、识别后的 信号 实线表示识别为第二类模式类 。将测试集中的 幅口型图像依次输入 进行判决分类后的识别率如表所示 本文算法的口型识别率方法本文算法识第一类别第二类 窒总识别率 最近邻法的仿真假设有劬 个类别的模式分类问题每类都有表明类别的样本 其中为测试样本 为第咀类的所有样本数。决策准则可以写为 这一决策方法称为最近邻法【 即对于未知类别的样本只要比较 与所有已知类别的样本之间的距离 并决策 与离它最近的样本同类 这样就识别 出属于哪一类 我们通常选用欧氏距离求两样本间的距离。同样地 我们用虚线表示测试图像被识别到第一类 如图所示 分别为两个模式类的测试图像为判决、识别后的 信号 虚线表示识别为第一类模式类 为判决、识别后的 信号 实线表示识别为第二类模式类 。将测试集中的 幅口型图像依次输入 进行判决分类后的识别率如表所示 最近邻法的口型识别率方法最近邻法识第一类别第二类 塞总识别率 最小距离法的仿真假设有 个类别的模式类每类都有表明类别的样本 章基于稀疏表示的人的口型识别对于一个未知类别的样本用欧氏距离求得 最小距离法‘就是将 归类到 最小的第 类。同样 我们用虚线表示测试图像被识别到第一类 如图所示 分别为两个模式类的测试图像为判决、识别后的 信号 虚线表示识别为第一类模式类 为判决、识别后的 信号 实线表示识别为第二类模式类 。将测试集中的 幅口型图像依次输入 进行判决分类后的识别率如表所示 最小距离法的口型识别率方法最小距离法识第一类别第二类 塞总识别率

  基于稀疏表示的人口型识别,稀疏表示,信号稀疏表示,吹笛子的口型,萨克斯口型,竹笛口型,吹笛子口型,口琴口型,音标口型,萧的吹法口型图解

http://idiomcoach.com/zirongyu/219.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有