834
浏览基于深度学习的无线通信(FM)语音增强的研究
摘要:调频调制是无线通信中常用的调制方式之一,它广泛的应用于卫星通信、蜂窝电话的系统、高保真的音乐广播等。但是当接收到的调频无线电信号较弱,信噪比较低时,传输过程中受到诸多畸变,会对接收端的语音的质量产生较大的影响。针对以上诸多畸变对无线通信语音信号的影响,为了保持可靠的无线电通信,同时为了降低传输过程中的诸多不确定性因素对调频语音信号的影响,设计一个高效及鲁棒的无线通信语音信号增强模型具有十分重要的意义。传统方法虽然针对每种畸变都有相应的解决办法,但是当需要同时处理信号传输过程中遇到的所有畸变时,则需要多种解决办法协同合作,实现起来较为复杂。而且当信道环境较差时,无法保证信号质量。本文引入了基于深度学习的语音增强方法,我们使用的深度学习的方法可以在无线通信接收端使用训练好的神经网络模型一次性同时解决多种畸变对语音质量的影响,即提高了增强后的语音质量,同时在面对恶劣的信道环境的情况时更加的灵活可靠,仍然可以保证接收端的语音质量。该方法可以有效的克服传统方法的缺点,同时可以达到更好的增强效果。本文针对使用基于深度学习的语音增强方法对无线通信接收端的语音进行增强的研究主要处理了以下两个问题:1、基于深度学习的方法要想有效的运行,首先要准备大量的可靠的数据集。本文结合了无线通信领域的通信信道的仿真模型,在开源数据集的基础上仿真了用于训练基于深度学习的无线通信语音增强模型的语音数据集。该数据集包含30多万条接近真实情况的仿真语音,使训练出的最好模型可以在仿真数据集上以及实际情况的无线通信语音上均取得一定的提升。其中在仿真数据集上PESQ和STOI分别提升了1.91和22.51%,在真实数据的频谱图上也可以看出对语音质量有一定的提升。2、本文借鉴了近几年基于深度学习的频域和时域的语音增强的三种网络结构及方法,并使用自己仿真的30多万条语音的数据集,共计训练了九个网络模型。通过模型测试结果可以对比出目前哪一类的基于深度学习的方法最适合无线通信语音增强任务。同时通过在真实采集的数据上进行测试,验证了本文使用的基于深度学习的无线通信语音增强的方法的可行性以及实用性。
关键词:无线通信;语音增强;
文章目录
摘要
ABSTRACT
第一章 引言
1.1 研究背景与意义
1.2 国内外研究现状
1.3 论文主要研究内容
1.4 论文组织架构
第二章 调频信号传输过程中受到的主要影响
2.1 加性噪声
2.1.1 产生原因
2.1.2 仿真模型
2.2 多径效应
2.2.1 产生原因
2.2.2 仿真模型
2.3 多普勒效应
2.3.1 产生原因
2.3.2 仿真模型
2.4 本章小节
第三章 FM传输过程中语音受到的影响仿真
3.1 加性噪声的仿真
3.2 多径效应的仿真
3.3 多普勒效应的仿真
3.4 FM通信信道的仿真
3.4.1 FM通信信道的仿真模型及参数
3.4.2 深度学习数据集的仿真
3.5 本章小节
第四章 基于深度学习的单通道语音增强
4.1 频域单通道语音增强
4.1.1 频域单通道语音增强概述
4.1.2 时频分解
4.1.3 特征提取和训练目标
4.1.4 波形合成
4.2 时域单通道语音增强
4.2.1 时域单通道语音增强概述
4.2.2 特征提取和训练目标
4.2.3 波形合成
4.3 无效傅里叶变换问题
4.4 评价指标
4.4.1 语音质量感知评估
4.4.2 语音短时客观可懂度
4.5 本章小结
第五章 基于深度学习的FM语音增强的结果分析
5.1 频域FM语音增强的结果分析
5.1.1 卷积循环神经网络
5.1.2 CRNN的网络结构及参数
5.1.3 改进的CRNN的网络结构及参数
5.1.4 实验结果
5.2 时域FM语音增强的结果分析
5.2.1 全卷积神经网络
5.2.2 FCN的网络结构及参数
5.2.3 实验结果
5.3 本章小结
第六章 总结与展望
6.1 研究工作总结
6.2 未来改进
参考文献
[1]语音增强的计算机仿真[J]. 马裕,齐凯,杨晓阔. 计算机仿真. 2011(01)
[2]无线语音通信电磁干扰仿真研究[J]. 彭文成,张文,王良,莫伟锋. 计算机仿真. 2010(01)