580
浏览高阶多数据集建模新方法与应用研究
摘要:随着信息技术的发展,大量学科中涉及的实验数据具有多模态性、多类型等特点。复杂的数据结构在带来更多信息的同时,也导致了传统的数据处理和分析方法的失效。为了解决该问题,本论文主要对高阶多数据集学习的建模、新方法和潜在应用进行研究。在理论建模中,主要围绕高阶多数据集共同成分分析等关键问题展开研究,利用张量代数、超图理论等数学工具,对数据多类型、多模态、数据集间共享信息等固有特征进行数学建模,为高阶多数据集学习算法提供了理论基础。在新方法研究中,论文提出了解决高阶多数据集联合成分分析、高阶多数据集联合修复和单通道盲源分离等问题的新方法。在潜在应用研究中,论文不仅利用包括多视频联合修复在内的多种机器学习典型应用验证所提出算法的有效性,并着重将高阶数据集的建模应用于无线通信领域,首次给了针对无线通信信号进行高阶建模可行性的理论分析,为通信信号处理新方法的提出提供理论支撑与新的思路。本论文对高阶多数据集建模新方法与应用研究的主要内容可归纳如下:1.基于张量分解的多数据集成分分析统一模型为了解决多数据集联合成分分析的关键问题,提出了一种新的多数据集联合成分分析方法,即广义多线性混合效应模型(GMMM)。该方法不仅可以在多个异构高阶数据集的条件下实现潜在成分估计,并且可以将提取出的成分自动划分为全局共同成分、局部共同成分和个体成分。首先,模型将传统的广义线性模型推广到张量数据集学习中,解决了多数据集结构和概率分布异构性的问题。其次,利用超图理论提出了一种新的图模型,该图模型解决了描述数据集间复杂相关性结构的问题。再次,通过引入了辅助模态的概念,实现了多数据集中潜在成分的分类。最后,利用仿真数据、图像特征分析、人脸识别和推荐系统等经典机器学习问题对模型进行评估。实验结果表明,GMMM提取的成分不仅可以正确反映出数据集之间共享和独占的信息,并且相比于传统算法,可以有效提高人脸识别和推荐系统问题分类和预测的准确度。2.基于矩阵级联的高阶多数据集联合修复基于张量的单数据集修复算法已经成功的应用于图像和视频修复当中,而对多视频联合修复问题的研究仍是空白。为了有效利用多视频之间的相关性结构提高修复效果,提出了一种新的多数据集联合修复算法。该算法利用多个张量沿共同模态展开矩阵进行级联的方式将多数据的共享信息引入模型、构建目标函数,并利用共轭梯度法对目标函数最优解进行搜索。数值实验结果表明,该算法的性能优于其他经典单数据集修复算法。特别是在数据的观测百分比极低的情况下,本算法可以给出更好的修复效果。3.基于共同邻接图结构的多数据集联合修复为了解决多数据集学习中数据集间严重的异构性和不平衡性对算法性能的影响,提出了一种新的多数据集信息共享机制。与传统算法中共享潜在成分的方法不同,新模型提出了一种新的共同邻接图(CAG)结构。该结构对异构和不平衡的多数据集学习具有更高的鲁棒性。同时利用该结构提出了一种新的多数据集联合修复算法。数值实验表明,该算法不仅在视频修复的性能上优于其他算法,而且在视频严重损坏的情况下仍可以给出良好的修复效果。4.张量模型在无线通信领域应用的可行性分析与新的欠Nyquist采样接收机结构首先从简单的调制波形出发对高阶张量模型在无线通信领域应用的可行性进行研究,给出完善的理论框架,从理论上证明了大多数通信信号在重排序条件下具有低秩结构,并分析了无线信道中高斯白噪声和码间串扰对低秩结构的影响。基于该结论,接下来为通用软件无线电接收机提出了一种新的采样与重构模型。该模型利用通信信号固有的低秩结构,可以对(多天线)通信信号以极低的速率进行随机采样并实现高精度重构。数据仿真与基于实测数据的实验结果表明,新的采样与重构模型可以在平均采样速率低于经典低通Nyquist模型、经典欠Nyquist采样模型,以及压缩感知的条件下,实现对多种通信信号的高精度重构。5.基于重排序的单通道盲源分离算法根据通信信号在重排序条件下具有低秩结构的提的,提出了一种新的单通道盲源分离算法,即重排序主成分分析(RsPCA)算法,并从理论上证明了信号成功分离的条件。大量数值仿真与基于实测数据的实验表明,在对通信信号的分离中RsPCA的性能不仅优于其他经典单通道盲源分离算法,并且可以在原信号之间的能量差别很大(弱信号的能量低于强信号20dB)的条件下实现微弱信号的提取。
关键词:张量分解;多数据集成分分析
文章目录
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 矩阵与张量分解
1.2.2 经典多数据集成分分析
1.3 论文主要研究内容及章节安排
第2章 基本理论概述
2.1 张量基本理论
2.1.1 张量的定义与建模
2.1.2 矩阵、张量的乘积
2.2 矩阵与张量分解理论
2.2.1 张量的CANDECOMP/PARAFAC分解
2.2.2 张量的Tucker分解
2.3 本章小结
第3章 广义多线性混合效应模型
3.1 多数据集联合成分分析的关键问题
3.2 模型理论框架
3.2.1 广义多线性模型
3.2.2 基于超图的相关性结构表示
3.2.3 辅助模态与成分选择
3.3 目标函数与优化算法
3.3.1 目标函数的建立
3.3.2 优化问题的求解
3.4 数值仿真与实验
3.4.1 语音信号特征分析
3.4.2 图像信号分析
3.4.3 人脸识别
3.4.4 推荐系统
3.5 本章小结
第4章 高阶多数据集的联合修复
4.1 数据修复与张量的低秩近似
4.2 基于矩阵级联的多数据集联合修复算法
4.2.1 基本模型与目标函数的建立
4.2.2 优化问题的求解
4.2.3 数值仿真与实验
4.3 基于共同邻接图结构的数据修复算法
4.3.1 共同邻接图结构
4.3.2 目标函数的建立
4.3.3 优化问题的求解
4.3.4 数值仿真与实验
4.4 本章小结
第5章 高阶数据集模型在无线通信领域的应用研究
5.1 高阶张量模型在无线通信领域应用可行性研究
5.1.1 基本理论模型
5.1.2 无线信道对信号低秩特性的影响
5.1.3 模型在多天线系统中的扩展
5.2 基于张量低秩凸分解的欠Nyquist采样与信号重构
5.2.1 采样与重构模型
5.2.2 数值仿真与实验
5.3 基于重排序的单通道盲源分离算法
5.3.1 理论框架与分离条件
5.3.2 重排序主成分分析算法
5.3.3 数值仿真与实验
5.4 本章小结
结论
参考文献
1]基于小波分量奇异值分解的单通道盲分离算法[J]. 张纯,杨俊安,叶丰. 电子测量与仪器学报. 2011