1029
浏览文本识别图像处理硕士论文提纲--基于深度学习的手写文本识别方法研究与应用
摘要:随着信息技术的快速发展,人们习惯于使用计算机处理和存储文本信息,但由于方便、快捷的特点,手写文本仍然随处可见,大量的手写文本数据使用、处理和保存,因此使用计算机技术实现大量的手写文本识别,具有重要的应用价值。本文将信息增益的思想融入到深度学习的样本学习阶段,并应用于识别脱机的手写文本。经过实验,模型识别率提高,训练时间明显缩短,最终将研究成果应用到手写文本识别系统中。本文的主要工作是:(1)考虑到手写文本识别图像采集过程中存在的问题,采用图像旋转、归一、图像噪声、图像灰度、图像二值等图像处理技术对手写文本图像进行预处理。在预处理之前,本文对各种预处理技术的各种方法进行了比较和实验,并选择了适用于手写文本图像处理的各种方法,包括霍夫变换的文本图像倾斜校正、平均过滤的图像噪声处理、最大值的图像灰度、全球阈值的图像二值、改进的直方图投影的大篇幅手写文本分割、双线插值的图像大小归一化。(2)使用BP神经网络和卷积神经网络算法来识别手写的文本图片,并辅以基于信息增益的样本学习方法来观察模型的最高准确性和运行时间。本文提出了三种信息增益方法,旨在在模型具有一定的识别率时,不再盲目地学习所有的样本,而是根据信息增益的思想有选择地学习样本。方法1:增加信息增益学习系数I,更容易识别神经网络的错误。方法2:增加学习阻断阈值F,以减少模型对垃圾样本的学习。方法3:引入具有高模型信息增益的样本作为专家样本。实验后,方法1和方法2有助于提高模型学习效率和模型识别准确性。以手写数字为例。当达到相同等级的准确性时,方法1和方法2的模型学习时间分别为54.4%和59.3%。(3)基于本课题的研究成果,在华为云的Modelarts平台上建立了手写文本识别原型系统。原型系统具有手写文本识别、人工审核等功能,具有一定的应用价值。其中,人工审核是为了保证高准确性的识别。模型识别后,根据模型识别可靠性低的样本进行人工识别和验证。其原理是随机取出大量样本,并得到模型Softmax函数的输出S值,并根据模型识别可靠性低的样本进行人工验证。
关键词:脱机文本识别;图像处理;深度学习;信息增益;原型系统;
致谢
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 研究现状
1.3 本文解决的主要问题
1.4 研究内容与技术路线
1.5 本文结构
2 手写文本识别的相关技术
2.1 引言
2.2 BP神经网络
2.3 卷积神经网络
2.4 信息增益
2.5 本章小结
3 手写文本识别图像预处理
3.1 引言
3.2 图像旋转
3.3 图像去噪
3.4 图像的灰度化
3.5 图像的二值化
3.6 手写汉字分割
3.7 图像大小归一化
3.8 本章小结
4 基于神经网络的手写文本识别算法研究
4.1 引言
4.2 手写文本数据集
4.3 基于神经网络的手写文本识别
4.4 基于信息增益的手写文本识别
4.5 本章小结
5 手写文本识别系统的设计与实现
5.1 引言
5.2 系统需求分析
5.3 系统设计
5.4 系统实现
5.5 本章小结
6 总结与展望
6.1 全文总结
6.2 进一步研究的工作
参考文献