命名实体识别论文提纲,命名实体论文提纲

2022-11-10 14:48 792 浏览

面向通信领域术语的命名实体识别


摘要:命名实体识别技术是自然语言处理中的一项基础技术,为其他任务提供重要的基础信息保障。本文所研究的通信领域具有知识专业性高、术语庞杂丰富、细分领域多样等特点,却缺乏必要的高质量实体列表和语料库,上述情况严重制约了该领域命名实体识别任务的开展。同时,虽然命名实体识别技术在常规领域已经取得了良好的效果,但当其应用于通信这种专业性强的领域时,往往会出现很多的适应性问题。目前,针对通信领域进行的命名实体识别研究甚少,随着通信技术的蓬勃发展,准确、高效的从通信领域专业文献中提取命名实体,是支撑自然语言技术在该领域深化应用的基础,对其他专业领域应用此项技术也具有较高价值的借鉴意义。本文围绕通信领域中文命名实体抽取任务展开,结合背景项目提供的资料,补充了中国通信标准化协会在《通信词典检索系统》中定义的术语,及从知网爬取的通信专业文献摘要的语料。本文对通信领域命名实体的特点进行了分析,提出了该领域嵌套命名实体构成的基本假设。然后基于此假设,重点研究了词典构建中的词汇领域性判别问题和特征选择中的字/词维度适配问题,提出了基于隐性迪利克雷分布(Latent Dirichlet Allocation,LDA)模型的词汇领域性判别方法,以及基于双层条件随机场(Conditional Random Field,CRF)模型的通信特征提取方法。随后,选择了若干通信领域特征,以长短期记忆网络(Long Short-Term Memory,LSTM)模型为基础,利用前置CRF层将领域知识映射进输入特征,构建了面向通信领域术语特点的命名实体识别模型。最后,对设计的特征进行了叠加测试,对识别的效果进行了对比测试,验证了所选领域性特征的有效性,以及所设计模型对通信领域的适用性。本文的成果已经应用于某企业通信知识图谱的构建工作中,为准确提取对象本体的标称量提供了重要基础技术支撑。同时,本文的成果对其他类似专业领域的命名实体识别研究也有重要的借鉴参考意义。 

关键词:命名实体识别;命名实体;


文章目录

摘要

Abstract

第1章 绪论

    1.1 研究背景与意义

    1.2 命名实体识别技术的研究现状

    1.3 本文主要研究内容

第2章 通信领域中命名实体的特点分析

    2.1 中文命名实体识别的特点

    2.2 通信领域命名实体和语料的获取

        2.2.1 命名实体的获取

        2.2.2 通信语料的获取

    2.3 通信领域命名实体特点分析

    2.4 对通信命名实体构成的假设

    2.5 本章小结

第3章 通信基础词典的构建

    3.1 命名实体识别中词典的作用

    3.2 通信基础词典的内容设计

    3.3 核心短实体的提取

    3.4 限定词的提取

    3.5 基于LDA的领域限定词提取

        3.5.1 领域限定词

        3.5.2 基于LDA的领域限定词提取

        3.5.3 模型与结果分析

    3.6 本章小结

第4章 基于BiLSTM-CRF的通信命名实体识别

    4.1 通信领域命名实体识别方法

    4.2 基于CRF方法的领域特征选择

        4.2.1 常规CRF方法的领域适用性分析

        4.2.2 双层CRF结构的通信命名实体识别

        4.2.3 带有通信领域特色的特征选择与模板设计

        4.2.4 双层CRF结构的可行性和不足之处

    4.3 基于BiLSTM-CRF模型的通信命名实体识别

        4.3.1 BiLSTM-CRF模型原理与领域适用性分析

        4.3.2 面向BiLSTM-CRF的特征向量

        4.3.3 CRF-BiLSTM-CRF识别模型

    4.4 本章小结

第5章 特征有效性验证及识别模型效果分析

    5.1 命名实体识别的评价指标

    5.2 基于双层CRF的特征有效性验证试验

        5.2.1 实验设置

        5.2.2 实验结果

        5.2.3 实验分析

    5.3 CRF-BiLSTM-CRF模型识别效果验证试验

        5.3.1 实验设置

        5.3.2 实验结果

        5.3.3 实验分析

    5.4 本章小结

第6章 结论与展望

    6.1 结论

    6.2 展望

参考文献


[1]基于LSTM-CRF的中医医案症状术语识别[J]. 李明浩,刘忠,姚远哲.  计算机应用. 2018(S2)

[2]命名实体识别方法研究进展[J]. 黄晴雁,牟永敏.  现代计算机(专业版). 2018(35)

[3]基于条件随机场和篇章校对的有机物命名实体识别方法研究[J]. 谷威,田欣.  情报工程. 2018(05)

[4]基于罪名相关成分标注的刑事裁判文书概要信息提取[J]. 刘晨玥,李兵,吴卫星.  山东科技大学学报(自然科学版). 2018(04)

[5]基于深度学习的渔业领域命名实体识别[J]. 孙娟娟,于红,冯艳红,彭松,程名,卢晓黎,董婉婷,崔榛.  大连海洋大学学报. 2018(02)

[6]工业4.0术语体系研究[J]. 岳磊,闫晓风,牛鹏飞.  标准科学. 2018(04)

[7]命名实体识别研究综述[J]. 刘浏,王东波.  情报学报. 2018(03)

[8]潜在狄利克雷分布模型研究综述[J]. 何伟林,谢红玲,奉国和.  信息资源管理学报. 2018(01)

[9]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)

[10]中文分词算法及改进研究[J]. 申琳.  电脑知识与技术. 2017(31)


相关内容
  • 无线通信中的多址接入技术研究
    论文提纲第一章 绪论1.1 研究背景 1.1.1 无线通信技术的发展概述 1.1.2 多址接入技术在无线通信中的重要性1.2 研究目的和意义 1.2.1 研究目的 1.2.2 研究意义1.3 国内外研究现状 1.3.1 国外研究现状 1.3.2 国内研究现状1.4 论文的主要内容和组织结构第二章 多址接入技术概述2.1 多址接入技术的基本概念 2.1.1 多址接入的定义 2.1.2 多址接入的分类2.2 传统多址接入技术 2.2.1 频分多址
  • 异构网络环境下的切换技术研究
    论文提纲第一章 绪论1.1 研究背景 1.1.1 移动通信网络的发展现状 1.1.2 异构网络的兴起与应用需求1.2 研究目的和意义 1.2.1 研究目的 1.2.2 研究意义1.3 国内外研究现状 1.3.1 国外研究现状 1.3.2 国内研究现状1.4 论文的主要内容和组织结构第二章 异构网络与切换技术概述2.1 异构网络的基本概念 2.1.1 异构网络的定义 2.1.2 异构网络的特点与类型2.2 异构网络的典型架构 2.2.1 蜂窝网
  • 量子纠缠在通信中的应用研究
    论文提纲第一章 绪论1.1 研究背景 1.1.1 量子力学的发展与量子信息科学 1.1.2 量子纠缠在通信领域的重要性1.2 研究目的和意义 1.2.1 研究目的 1.2.2 研究意义1.3 国内外研究现状 1.3.1 国外研究现状 1.3.2 国内研究现状1.4 论文的主要内容和组织结构第二章 量子纠缠的理论基础2.1 量子纠缠的基本概念 2.1.1 量子态与量子叠加原理 2.1.2 量子纠缠的定义与特性2.2 量子纠缠的产生与制备
  • 通信论文提纲:基于ZigBee的无线传感器网络设计论文提纲
    通信论文提纲:基于ZigBee的无线传感器网络设计论文提纲第一章 绪论1.1 研究背景 1.1.1 无线传感器网络的发展现状 1.1.2 ZigBee技术在无线传感器网络中的应用1.2 研究目的和意义 1.2.1 研究目的 1.2.2 研究意义1.3 国内外研究现状 1.3.1 国外研究现状 1.3.2 国内研究现状1.4 论文的主要内容和组织结构第二章 ZigBee技术与无线传感器网络概述2.1 ZigBee技术原理 2.1.1 ZigBee协议栈结构 2.1.2 ZigBee网络拓扑
  • 通信论文提纲--基于OFDM的通信系统设计
    通信论文提纲--基于OFDM的通信系统设计第一章 绪论1.1 研究背景1.1.1 无线通信发展的现状1.1.2 OFDM技术在通信中的应用1.2 研究目的和意义1.2.1 研究目的1.2.2 研究意义1.3 国内外研究现状1.3.1 国外研究现状1.3.2 国内研究现状1.4 论文的主要内容和组织结构第二章 OFDM技术基础2.1 OFDM的基本原理2.1.1 正交频分复用的概念2.1.2 OFDM的数学模型2.2 OFDM系统的关键技术2.2.1 IFFT/FFT在OFDM中的应用2.2.2 循环
相关推荐
  • 眼图论文提纲,串行通信论文提纲
    眼图测试在串行通信系统中的应用研究摘要:串行通信技术是目前数据通信采用的主要方式,但由于传输过程中噪声等因素的影响,串行信号可能会出现码间干扰,信号畸变等问题。日益增长的传输速率使噪声和抖动对信号质量的影响更加突出,如何保证通信的可靠性愈加重要。眼图作为一种直观、快速地分析串行信号质量的方法,可以衡量通信系统性能的优劣。通过眼图测试方法分析串行
  • 模块化多电平换流器论文提纲
    模块化多电平换流器(MMC)通用平台设计与研究摘要:模块化多电平换流器(modular multilevel converter,MMC)具有运行效率高、输出特性好、可拓展性强等优点,在柔性直流输电领域得到了广泛应用。本文针对现有MMC工程样机存在通用性不足的缺点,研制了一台以T型全桥子模块为基本拓扑的25电平MMC实验平台,并针对实际工程中子模块等效测试的需求,提出了一种MMC子模块运行工况等效试验方案
  • 双二进制信号论文提纲
    基于双二进制信号的高速串行通信接收电路设计摘要:随着大数据及5G通信时代的到来,人们对更高效、更安全的数据传输的需求不断增加。先进的半导体工艺及电路结构可大幅提高SerDes收发机的信号处理速率,而高速串行通信链路之间的有限带宽信道成为制约数据传输速率的瓶颈。因此,多电平信号技术相对于NRZ信号对带宽需求较小的优势被展现出来。其中,双二进制信号(duo-binary,DB)
  • 高速串行通信论文提纲
    高速串行通信链路扩频时钟发生器关键技术研究摘要:为了满足人们日益增长的数据传输需求,高速串行通信(SerDes)以其成本低、抗干扰能力强等优势受到广泛关注。扩频时钟发生器是链路中重要的模块,其抖动对系统的误码率至关重要,尤其是使用有效抑制电磁干扰的扩频技术带来的额外抖动。以高稳定性、高可靠性和低功耗、低抖动实现扩频时钟是高速SerDes中待解决的问题之一。本
  • 加密算法论文提纲
    基于AES算法的加密UART IP核设计与实现摘要:在当今信息化时代,信息安全问题已然成为不容忽视的严峻问题。信息加密作为保障信息安全的核心技术,在保障数据通信安全中占据着重要的地位。目前信息加密的实现方式主要有软件和硬件两种,而软件实现方式在执行效率上无法满足人们对信息安全的需求。因此开展串行通信接口的硬件加密研究对保障信息安全有着重要的现实意义。本论
热门内容
  • 东方甄选SWOT分析战略
    东方甄选是一家专注于高品质商品的电商平台。进行其SWOT分析可以帮助识别其内部优势(Strengths)和劣势(Weaknesses),以及外部机会(Opportunities)和威胁(Threats)。以下是基于一般情况的东方甄选SWOT分析:优势(Strengths)品质保证:东方甄选可能注重商品的品质,为消费者提供高质量的商品。精准定位:面向追求高品质生活的消费群体,定位清晰。品牌形象:可能建立了良好的品
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 二十届三中全会论文范文
    题目:二十届三中全会对中国经济结构调整的战略部署摘要: 二十届三中全会为中国未来的经济发展指明了方向,尤其是在经济结构调整方面,提出了明确的战略部署。本文从全会的主要内容出发,探讨经济结构调整的必要性及其面临的挑战,分析全会提出的战略部署,包括推动产业升级、促进区域协调发展、加快科技创新等。通过对这些战略措施的深入探讨,本文进一步提出经济
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 党的二十届三中全会精神理论论文
     党的二十届三中全会精神理论论文摘要党的二十届三中全会是在中国特色社会主义进入新时代的重要会议,全面总结了党的十九大以来的工作成就和经验教训,明确了新时代全面深化改革的新目标和新任务。本文旨在深入解读二十届三中全会精神,探讨其在理论和实践中的重要意义。通过分析全会提出的主要战略部署,包括坚持和完善中国特色社会主义制度、深化改革开放、全面
联系方式
  • 13384015218
  • 13384015218
  • hnksw@163.com