4902
浏览基于强化学习的雷达干扰策略分配技术研究
摘要:在当前的战场环境中,随着相关软硬件技术的飞速发展,雷达正在朝着多功能的方向逐步演进,甚至已经达到多个雷达一起探测目标的要求。不同于传统雷达的固定工作模式,如今的多功能雷达更倾向于采取多工作模式,根据当前雷达自身所处的工作环境以及面临的任务要求,实时的调整相关参数。而传统的干扰系统遵循着固定的干扰策略,实时性低,不能满足现代战争的需求,亟需对认知干扰进行研究。论文以突防作战为背景,在不同雷达环境下对干扰资源进行自适应的分配。论文的主要工作如下:首先对雷达作用距离和发现概率进行研究,确立了信噪比与发现概率之间的关系。建立雷达信号处理模型,探究对雷达信噪比产生影响的模块的基本原理,并定量去计算这些模块对信噪比的改变。对多功能雷达的工作模式进行分析,为雷达对抗环境的建立奠定了基础。其次介绍了几种典型的雷达有源干扰样式,按对雷达系统的不同效果分为压制干扰和欺骗干扰并对干扰进行仿真。使用功率准则和概率准则分别作为压制干扰和欺骗干扰的评估指标,结合雷达信号处理模型给出压制干扰对不同雷达系统信噪比的影响,仿真对比在不同距离和压制干扰下雷达的发现概率,以雷达抗欺骗干扰概率建立欺骗干扰的评估模型。最后将强化学习算法应用到雷达智能干扰决策中,对雷达环境和干扰资源进行建模,设计了雷达状态,干扰机动作和训练奖励。利用强化学习算法对多种多功能雷达的随突防航距和状态变化的干扰资源实时分配进行了仿真实验,结合先验知识进一步提高决策的效率,从算法收敛速度和收敛时突防成功率对DQN算法和PK-DQN算法进行对比,表明了强化学习算法能有效的完成干扰资源分配任务。
摘要
abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 干扰策略分配的研究现状
1.2.2 强化学习的研究现状
1.3 论文研究工作及内容安排
第2章 雷达系统功能建模仿真
2.1 雷达作用距离
2.1.1 基本雷达方程
2.1.2 门限检测
2.1.3 起伏目标检测
2.2 信号处理模块
2.2.1 脉冲压缩
2.2.2 脉冲累积
2.2.3 杂波对消
2.3 多功能雷达工作模式
2.3.1 搜索模式
2.3.2 跟踪模式
2.3.3 制导模式和失踪模式
2.4 本章小结
第3章 雷达有源干扰样式及干扰效果评估研究
3.1 有源干扰概述
3.2 压制干扰样式
3.2.1 噪声调幅干扰
3.2.2 噪声调频干扰
3.2.3 灵巧噪声干扰
3.2.4 密集假目标压制干扰
3.3 欺骗干扰样式
3.3.1 距离欺骗干扰
3.3.2 速度欺骗干扰
3.3.3 距离-速度联合干扰
3.4 有源干扰效果评估
3.4.1 干扰效果评估准则
3.4.2 对雷达的压制干扰效果评估
3.4.3 对雷达的欺骗干扰效果评估
3.5 本章小结
第4章 基于DQN算法的雷达干扰资源分配
4.1 强化学习基本原理
4.1.1 强化学习模型
4.1.2 马尔科夫决策过程
4.1.3 DQN算法
4.2 马尔科夫决策过程建模
4.2.1 状态
4.2.2 动作
4.2.3 奖励
4.3 干扰资源分配仿真分析
4.3.1 干扰对抗场景
4.3.2 干扰资源分配结果
4.3.3 算法性能比较
4.4 本章小结
结论
参考文献