一、半结构数据中的结构推理(论文文献综述)
熊中敏,马海宇,李帅,张娜[1](2022)在《知识图谱在海洋领域的应用及前景分析综述》文中认为知识图谱主要用于从复杂数据中抽取出关键信息以生成关系网络,其对于复杂关系出色的识别能力以及对于数据较强的描述能力使得知识图谱技术具有很高的应用价值。为给知识图谱在海洋领域的应用提供理论支撑,对知识图谱相关技术进行了总体概述。阐述Citespace文献分析工具的出色应用,针对海洋领域半结构化和非结构化数据抽取技术进行了系统整理,并分析了诸如命名实体识别、关系抽取、事件抽取、知识融合以及知识推理等关键性技术的原理及后续改进,对海洋领域应用知识图谱技术的落地场景及未来前景进行总结与展望。
李茵[2](2021)在《面向医院管理的数据驱动决策研究》文中提出信息技术的快速发展与应用以及大数据战略的深入实施,使得大数据成为科技创新引领与决策支撑的重要战略资源,科学研究与实践正在完成“假设驱动”到“数据驱动”的巨大转变,大数据的深度挖掘与利用能够为社会发展、政府治理、国家安全等提供新的动能。围绕国家大数据战略,丰富和拓展大数据应用创新领域,推动管理升级,给学术界、产业界以及政府部门带来许多新的重要课题。其中面向健康服务供给侧的决策支持、决策引导和决策创新中的数据驱动、数据价值转换问题即是管理学、数据科学的核心科学问题之一,更是情报学应对大数据环境开展智慧型情报服务必须解决的关键问题之一。健康医疗大数据时代的到来,促使医院管理和医院管理者的观念都随之变化。数据驱动对医院精细化、智慧化管理决策具有重要意义。本研究从提升医疗管理决策质量的角度出发,构建数据驱动医院管理决策过程模型,分析数据驱动医院管理决策的影响因素,进而提出面向医院管理的数据驱动决策模型,并展开实证研究,为数据驱动决策领域的研究理论基础和实证研究提供参考依据,为促进医院精细化管理提供对策及建议。基于此,通过界定“数据驱动”、“医院管理”、“医院管理评价”与“数据驱动决策”等相关概念,以回顾数据驱动决策、面向医疗健康领域的数据驱动决策、面向医院管理的数据驱动决策以及数据驱动决策的影响因素研究现状为基础,综合运用文献调研法、半结构访谈法、问卷调查法、扎根理论法、结构方程法、统计分析法、机器学习法分析了面向医院管理的数据驱动决策的过程模型和影响因素模型,并构建了面向医院管理的数据驱动决策模型。围绕面向医院管理的数据驱动决策模型这一核心研究内容,本文第三章在已有BASM模型研究过程的基础上,结合医院管理决策场景的特殊性,探索面向医院管理的数据驱动决策的运行机理,构建面向医院管理的数据驱动决策过程模型,以梳理驱动的路径,理清其中的内在逻辑。该模型由处理过程模型及支持过程模型两部分构成,旨在分别回答面向医院管理的数据驱动决策过程中两个核心问题,一是数据本身如何转化并如何嵌入到医院管理决策过程中,二是医院中能够支持并且推动数据驱动决策的途径是什么。第四章采用扎根理论进行了面向医疗管理领域数据驱动决策的影响因素识别研究,编码面向医院管理者的半结构化访谈资料,经过饱和度测试,最终识别出了四个维度的影响因素。第五章在对影响因素定性研究的基础上利用结构方程模型方法进一步验证影响因素,探讨相关变量的权重和关系。阐述各个因素对医院管理决策的影响关系,验证数据驱动医院管理决策影响因素模型。第六章整合数据驱动医院管理决策过程模型和影响因素模型,构建支持医院管理决策全过程的数据驱动决策模型,探讨过程模型与影响因素模型的内在联系。第七章根据已构建的面向医院管理的数据驱动决策模型,进行基于DRGs分组的医疗服务能力评价和医生绩效评价管理工作的实证研究,修正和完善已构建的模型。具体内容如下:(1)构建面向医院管理的数据驱动决策过程模型。基于现有的数据驱动决策机制模型,结合医院管理实践,构建面向医院管理的数据驱动决策过程模型,该模型由处理过程模型及支持过程模型两部分构成,处理过程模型包括面向医院管理决策的数据处理过程和数据驱动的医院管理决策处理过程。决策处理过程既是数据处理过程的最后阶段,对数据处理的结果进行展示与应用,又会不断地产生新的数据,前推已有数据的老化和错误,补充和修正数据处理过程。而数据处理过程以决策处理过程中的阶段性需求为导向,能嵌入到决策处理过程的所有阶段,为决策处理的全流程服务。支持过程模型主要涉及两用户一技术。两用户包括数据分析人员和管理者,使能技术是创建和改进能够嵌入到操作系统的分析工具,这三个主体不能割裂独立,而可以互相转化并可能同时存在,共同对数据和决策进行处理,支持处理过程模型运转。(2)系统分析了面向医院管理的数据驱动决策影响因素。对主观及客观上影响管理者数据驱动决策的因素进行整合和相关分析,确定四个核心影响因素范畴分别是医疗数据质量,信息技术,医院组织管理和管理者信息素养,构建了影响因素模型,发现数据驱动医院管理决策能受到管理者信息素养、医院组织管理和信息技术的正向影响,其中管理者信息素养最强,其次是医院组织管理和信息技术;医院组织管理对医疗数据质量、管理者信息素养、决策目标均有影响,对医疗数据质量的影响要强于管理者信息素养;医疗数据质量能够对信息技术产生正向影响;信息技术对决策目标具有正向影响。(3)构建了面向医院管理的数据驱动决策模型。将过程模型与影响因素模型有机结合在一起,构成了面向医院管理的数据驱动决策模型。打造数据驱动决策模型,将医院数据质量标准化管理贯穿于医院管理全流程、智能化管理提升医务人员的信息技术、高效化管理增效医院组织三个方面分析模型的实现,提出模型优化建议。(4)基于DRGs的肺癌医疗服务绩效分析实证研究。模拟医院管理中运用DRGs分组工具解决绩效问题的真实场景,应用数据驱动医院管理决策模型,优化DRGs分组,优化绩效管理。研究最终确定性别、年龄、入院途径、离院方式、住院次数、医保付费方式、是否手术、合并症严重情况八个因素为影响肺癌医疗服务费用的因素,构建了8个DRGs分组,其中合并症严重程度、是否手术、住院次数是决策树分组的分类结点变量。选用医疗服务能力的指标(DRGs总权重、CMI)根据获取的数据进行比较,完成绩效评价工作,实现基于数据驱动决策的绩效管理。
蔡新辉[3](2021)在《基于多源异构数据的地方风土人情知识图谱构建方法及应用研究》文中研究表明随着信息化与大数据时代的迅猛发展,人们在生活中所面临的信息也越加的纷繁复杂,但真正能有所帮助的信息十分有限,究其原因是因为这些信息没有针对性和规范性。有效的解决方法是将信息有所针对性的结构化处理。知识图谱(Knowledge Graph)因为在数据关联度和结构化方面的优势,受到越来越多的关注。目前知识图谱已经在多个领域得到应用,包括开放领域,以及医疗、教育、电影等垂直领域。风土人情,是一个地方特有的自然环境、风俗、礼节、习惯的总和,具有很高的人文和自然价值。但是针对该领域的知识图谱构建及应用还处于初步探索阶段,因此对于地方风土人情知识图谱的构建方法及应用的研究很有必要。传统的知识图谱构建方法的数据不够多源。而对于从文本中抽取实体关系三元组,传统的方法对于有重叠实体的三元组的抽取效果不理想。针对以上现状,本文围绕地方风土人情领域,对知识图谱的构建和应用给出一种解决方案,主要研究内容如下:(1)以内蒙古地区为例,构建内蒙古风土人情知识图谱。针对风土人情领域,在几种传统的垂直领域本体构建方法的基础上进行一些优化,使本体构建方法更适合于风土人情领域。在本体的约束下,基于多种来源、不同结构的数据,利用信息抽取技术,分别从中抽取出实体关系三元组,经知识融合后存入图数据库,完成内蒙古风土人情知识图谱的初步构建。(2)借鉴一种分层标注的方法,提出一种基于BERT-CRF的分层标注模型,从文本中联合抽取实体和关系。首先引入BERT对输入文本进行编码,并利用CRF标注出三元组的主语。在此基础上,针对每一种预定义的关系,采用半指针半标注方法,利用双指针标注出对应主语和关系下的宾语在文本中的首尾位置,进而将三元组完整抽取出。相较于原分层标注和传统的三元组抽取方法,三元组抽取效果有所改善。(3)基于一种管道式的知识图谱问答方法,对其实体提及识别模块进行改进,借鉴分层标注的三元组抽取中宾语的抽取思想,提出一种基于半指针半标注的实体提及识别方法,采用双指针从问句中标注出实体提及,识别效果和问答效果均有所提升。(4)基于内蒙古风土人情知识图谱和知识图谱问答方法,设计实现内蒙古风土人情问答平台,包括基于知识图谱的问答功能、知识图谱可视化和实体图片的展示功能,并允许用户提交三元组,以众包的方式更新知识图谱。
马志明[4](2021)在《基于知识图谱的食品对话系统的设计与实现》文中研究指明随着我国全面建成小康社会的实现,人们对饮食的需求由温饱问题转变为健康问题,这一转变使人们更加重视饮食结构,对食品及健康方面知识的需求越来越强烈。互联网的相关信息存在信息分散、数据质量低等问题,海量参差不齐的数据增加了人们获取有用信息的难度。使用浏览器搜索数据是人们惯用的查询信息的手段,但基于关键词的查找较为局限,不符合人们自然语言的特点。食品知识本身专业性强,人们难以从搜索返回的庞杂冗余的结果中筛选整理出正确的适合自已的食品信息。因此,人们急需一个整合了食品相关知识并提供高质量的食品信息的信息获取平台。谷歌在2012年提出了知识图谱概念,知识图谱可以挖掘网页文本中的概念和它们之间的关系并进行语义表示,即抽取过滤互联网上的庞杂数据,整合多数据源的数据,最终表示为知识对象。知识图谱为整合过滤食品信息提供了新的思路。对话系统是近些年提出的优于搜索系统的获取信息的另一种手段,对话系统可以理解用户的语义信息,有针对性的快速给出高质量回复,且以对话的形式以自然语言的方式与人进行交流,更贴近人的语言习惯。本项目为了满足人们对于获取饮食、营养、健康等方面信息的需求,构建了食品领域知识图谱,并提供一个食品领域对话系统。本项目主要开展了如下的工作:一、本项目针对领域数据的特点,使用一种以需求为导向的,逐步完善的,自底向上与自顶向下相结合的,领域知识图谱“三步”构建法,构建了包含食物、菜肴、餐厅、地点、营养元素、人群、症状、功效、季节九大类本体的食品领域知识图谱。二、将引入BERT预训练模型的BiLSTM+CRF实体识别算法用于食品的实体识别任务,分析对比了该模型相对于其他模型的优势。实验结果表明BERT+BiLSTM+CRF在本项目构造的数据集上达到91.55%的F1值,证明该模型能够充分提取字符、词语、句子甚至句间关系的特征,在食品实体识别任务中取得了较好的效果。设计了一个基于别名词表与综合评分筛选算法,对应用该方法筛选出相近实体的候选食品对做支持向量机SVM模型的分类任务,将分类为同一实体的食品对链接为相同实体。三、应用本项目构造的食品知识图谱,设计并实现了一个食品领域对话系统,该系统具备对话食品相关知识及简单问候功能,系统功能正常、性能良好。本项目通过构建食品领域知识图谱整合了食品相关知识,并提供一个食品领域对话系统,方便人们高效、便利的获取高质量食品相关知识,具有一定的研究意义和应用前景。
杨小敏[5](2021)在《基于深度学习的垂直领域知识图谱构建方法研究与实现》文中研究指明随着人工智能的发展,智能的信息服务持续升级,在各种智能信息服务领域均能看到知识图谱的应用,如智能问答、个性化推送、信息检索等。知识图谱帮助计算机学习人的语言交流方式,使计算机像人类一样“思考”,使得各种信息服务反馈给用户更加智能的答案。可以说知识图谱是传统行业和人工智能进行融合的方向,也是人工智能从研究走向落地应用的过程中必不可少的环节。垂直领域知识图谱是针对某个行业,根据该领域的数据来构建的知识图谱,相比于通用知识图谱,更强调知识的深度。虽然在通用领域,学术界和工业界都已经有大规模的标注数据可供知识图谱构建模型进行训练,并且实体和关系抽取技术已经取得了长足进步。但在垂直领域的场景下,存在着标注语料数据量不足,人工标注耗费钱力和精力等难题,并且随着业务的变更,实体和关系的类型会不断地更新,已有的标注数据无法应用在新的实体和关系类型上,这些难题使得在垂直领域构建知识图谱变得非常困难。为了解决垂直领域知识图谱构建困难和低效的问题,本文主要研究如何进行行业知识的抽取,并自动高效准确地构建垂直领域知识图谱。首先,为了构建用于进行知识抽取模型训练的增强数据集,本文提出基于词典和实例交叉的增强数据生成算法。其次,针对行业产品文档中的半结构化数据和非结构化数据,分别设计并实现了基于序列标注和子模式生成的表格知识抽取算法Bi-LSTM-CRF-SSG和基于BERT和概率图模型的联合实体关系抽取模型BERT-PGM。实验结果表明,经过后续容错处理,在测试数据集上,半结构化数据抽取算法能达到99.13%的抽取准确率,非结构化数据抽取算法能达到95.7%的抽取准确率。最后,本文实现了一个垂直领域知识图谱自动构建系统,并从功能和性能两个方面进行了系统测试,测试结果表明系统的功能和性能均满足用户需求。
马超童[6](2021)在《面向科技咨询的知识图谱构建与管理平台的设计与实现》文中研究说明面向科技咨询的知识图谱构建与管理平台是为领域专家、科技咨询专家和知识图谱研究人员提供的,从结构化、半结构化、非结构化数据源中获取高质量知识体系的工具。该平台应具备以下三个特性:构建流程的各环节衔接顺畅,全生命周期工程化;以大数据技术融合海量、多源、异构的领域数据,以人工智能技术驱动大规模知识获取,平衡自动化方式与人工方式的矛盾;可操作性强,实现多领域复用。目前知识图谱相关产品虽然取得了一些显着成果,但仍存在领域数据层次化不明确且跨域连接难、准确性与效率难以兼顾、构建全流程各环节分散且知识挖掘不充分等问题与挑战:1)传统的跨数据库扫描方式已逐渐无法适用于海量、多源、异构数据的知识获取与分析需求;2)领域知识图谱构建面临着准确性与效率之间的矛盾,自顶向下方法保证了知识的准确性,但过程繁琐、知识规模受限,自底向上方法适用于大规模知识获取,但图谱结构松散、缺乏严格的模式约束;3)现有平台的各步骤需要投入大量的时间与人力,以完成分散环节的衔接。针对上述问题与挑战,本文重点围绕科技咨询大数据统一信息模型、领域知识图谱本体和数据的构建方法、面向科技咨询的知识图谱构建与管理平台的设计与实现等开展研究,主要内容分为以下三项:1)设计并实现了一套面向数据跨域融合的“主题化—层级化—关联化”的科技咨询大数据统一信息模型。以横向主题域划分、纵向多层次建模、业务标签组织关联的方式,打通了当前科技咨询领域的多主题、多来源、异构数据,为科技咨询领域资源体系标准规范的制定提供了依据;同时,对于其他领域的数据资源统一管理与本体建模产生了一定的参考价值。2)设计并实现了一种基于混合模式的领域知识图谱本体和数据的构建方法。以自顶向下的人工过程为主线,定义本体的标签概念层级体系和关系集合,保证了领域知识图谱的专业性;以自底向上的数据驱动过程为辅线,借助自然语言处理模型获取知识,实现了图谱规模在本体框架的严格约束下扩展。3)设计并实现了松耦合模式、可自由编排任务流的领域知识图谱构建与管理平台。通过“大数据平台+AI开放平台+知识图谱平台”三者互相支撑,平衡了自动化流程与人工参与的关系,提高了现有资源的利用率,增强了平台的环节流畅性和拓展复用能力。最后,该平台应用于国家重点研发计划项目“基于大数据的科技咨询技术与服务平台研发”中,在科技咨询背景下构建了人工智能、大数据、量子通信等九个前沿领域的技术链和产业链知识图谱,验证了本文理论方法及平台的有效性与实际应用价值。
谢炎宏[7](2021)在《地震灾害防治信息智能匹配算法研究》文中认为地震作为一种成因复杂的地质运动,其诞生时往往伴随着地陷、洪涝、火山爆发等多种类型次生灾害,在城市、平原、山地等不同环境条件下,灾害的表现形式与后果亦不尽相同。由于地震具有灾害风险巨大、衍生危害多样、影响范围广泛等特点,提高地震防灾减灾工作信息化水平对保护人民群众生命财产安全至关重要。现有地震信息服务系统中单一化的防震减灾策略无法满足随灾害链演变进程即时变化的防震减灾需求,亟需一种针对地震灾害事件、场景和用户类型的变化,得出最优应对策略的地震信息服务算法。知识图谱作为一种展现异构数据间潜在关联的语义网络,能够有效地建立不同信息间的逻辑关联。因此,本文提出了一种基于知识图谱的语义匹配算法,通过建立地震灾害信息、场景和防震减灾策略间的语义关联,优化用户实际需求与防震减灾信息间的语义匹配关系,从而提供最恰当的地震灾害防治信息服务。提高不同场景、不同灾害进程阶段防震减灾信息服务的智能化应对。本文的主要研究工作和成果如下:(1)提出一种基于语料库的地震灾害防治信息本体库设计。通过地震灾害语料的收集、处理和标注,建立地震灾害防治领域词典。以此为依据,分析地震灾害信息服务的领域特征,剖析地震灾害信息、基础数据、应用场景和用户类型在防震减灾信息服务过程中的结构关系,进而以地震灾害事件、防震减灾策略、相关数据和功能服务这四类本体为核心,设计相应的概念、属性和层次关系,构建地震灾害防治信息本体库。(2)设计并构建了面向场景的地震灾害防治知识图谱。以地震灾害防治信息本体库为基础,以“场景—防震减灾策略”为核心,围绕四类本体的概念设计,自顶向下构建知识图谱模式层。以地震灾害防治语料库为数据基础,自底向上构建知识图谱数据层。分析了知识抽取、知识融合和知识推理等关键环节的技术特点。建立“模式层—数据层”的关系映射,形成基于场景的地震灾害防治知识图谱。(3)设计了一种基于知识图谱的语义匹配算法,并通过实例进行验证。在语义匹配算法的基础上,引入知识图谱技术建立地震灾害信息间的语义关联,依据用户意图匹配模板,综合调用地震信息实体和相关功能服务,实现面向用户需求的智能化信息服务。通过应用案例数据对地震灾害防治信息智能匹配算法研究成果进行验证,结果表明,本文提出的语义匹配算法能够依据用户需求提供对应的防震减灾相关功能服务。
李新琴[8](2020)在《高速铁路安全文本大数据分析方法研究》文中认为我国是世界上高速铁路建设和运营规模最大的国家,同时也是外部环境和运营场景最复杂的国家,为保障高速铁路安全运营,已经形成了具有中国特色的超大规模、超强客货需求的路网运输组织和安全保障技术。随着高速铁路运营里程的积累,产生和存储了面向路网运营与安全的海量多源异构数据,这些数据承载了路网重要的安全信息,借助和运用大数据技术,挖掘高速铁路安全数据价值,全面了解高速铁路运营的安全状况、安全规律以及安全影响因素,采取科学有效措施预防和控制事故故障及其影响,是提升路网运输安全保障水平的必要途径。高速铁路安全涉及铁路各个专业,数据来源较多并且类型复杂,其中大量数据都是以文本、图像、音频等非结构化形式存储,以文本形式存储的高速铁路安全数据是非结构化数据的主要载体,许多研究学者对该类文本数据进行了研究,提出了很多具有借鉴价值的文本数据分析方法,但没有对安全文本数据进行系统的分析,存在数据分析零散、分析方法普适性不强的问题。本文围绕高速铁路安全文本数据,总结安全文本数据来源、特点及其分析价值,采用知识图谱构建与应用的方法实现安全文本数据的价值挖掘,针对高速铁路设备故障数据,提出了一系列文本分析方法构建故障诊断与处理知识图谱,并将理论与实践相结合,依托铁路数据服务平台构建高速铁路安全文本大数据平台,论文的主要工作包括:(1)基于深度学习集成的高速铁路设备故障分类方法。针对高速铁路设备故障文本数据特征,提出了组合加权集成方法将BiGRU和BiLSTM深度学习网络进行集成,采用ADASYN自适应综合过采样方法解决设备故障数据类别不均衡问题,构建了基于深度学习集成的高速铁路设备故障分类模型,实现了高速铁路设备故障自动分类。采用高速铁路2008-2018年的道岔设备故障数据进行实验,实验证明本文提出的基于深度学习集成的设备故障分类模型是一种分类性能较高的分类模型。(2)高速铁路设备故障命名实体与实体关系抽取方法。根据设备故障文本数据定义故障诊断与处理的命名实体与实体关系知识结构,采用BIOES标注方法统一标注命名实体与实体关系样本数据,提出了多维字符特征表示+BiLSTM+CRF的命名实体抽取方法,以及多维分词特征表示+Transformer的实体关系抽取方法,实现了设备故障文本数据中关键信息的自动抽取。采用高速铁路2008-2018年的道岔设备故障数据对模型进行实验验证,实验证明本文提出的命名实体与实体关系抽取方法均具有较高的精确度。(3)基于概念相似度计算的设备故障实体对齐方法。针对命名实体抽取方法抽取出来的设备故障命名实体存在冗余问题,提出了基于《知网》概念相似度计算的实体对齐方法,通过设备故障实体词汇抽取过程、概念相似度计算过程以及实体对齐过程,实现了设备故障冗余命名实体的去重与统一。采用设备故障命名实体进行方法验证,实验证明基于概念相似度计算的命名实体对齐方法能够有效解决设备故障命名实体冗余问题。(4)高速铁路安全文本大数据平台设计与实现。提出了高速铁路安全文本大数据平台的总体框架、技术架构以及功能架构,设计安全文本数据分析的业务流程以及模型的动态交互方式,实现了安全文本数据从样本标注、模型训练、应用分析为一体的智能化操作平台,并对平台的核心功能进行了展示,以构建信号设备故障诊断与处理知识图谱为案例,介绍了各设备故障文本分析方法在平台上的实现过程。平台现面向中国铁道科学研究院集团有限公司下属各单位应用,通过各专业科室对各自的高速铁路十年的安全文本数据分析,证明本文的研究成果能够切实有效的解决高速铁路安全文本数据分析问题。
宋伟[9](2020)在《环境大数据异构信息融合方法研究》文中认为大数据时代,数据的种类变得多样化,数据规模也日益增大,从这些各种类型的数据中得到较高利用价值的需求变得更为迫切。大数据中所包含的信息没有办法度量,而大数据分析迫切地需要将多种多样的数据源进行统一,使用传统的信息处理方法已经愈发窘迫,不能很好的完成任务。由于数据的结构差异性大、数据的来源广泛,数据中的价值密度不高等特点,对大数据的利用产生了巨大挑战,而多源异构信息融合为大数据环境下进行信息获取、组织和利用提供了一种高效的手段和方法。针对异构信息的融合,构建知识图谱是一种行之有效的手段。本体是共享概念模型的形式化说明,可以对环境领域信息进行形式化描述,这种形式化的描述可以通过自动推理挖掘出隐藏信息。知识图谱通过实体与实体关系的大规模语义网络,把知识变得更具有共享性和高效性。所以,使用基于本体的知识图谱来对环境领域的各项信息进行融合能将各类数据进行整合,进行分析。针对如上问题,本文利用自上而下知识图谱构建理论基础,优化了短文本中三元组的提取,并在环境知识图谱采集展示原型新系统应用。首先,完善了一般知识图谱的构建过程,借助本体建模工具Protégé构建环境信息领域本体;其次,对于文本数据利用句法依存提取方式提取基础三元组,将通用知识图谱和特殊领域知识图谱进行融合,并将图谱数据存入Neo4j图形数据库中,初步构建环境数据领域知识图谱;最后,设计开发了环境知识图谱采集展示系统原型,用以存储和管理环境领域知识。本课题对数据融合和知识图谱进行研究,为异构环境数据信息的采集和管理建立了基础。第一,基于本体建模方法对基础数据类型进行建模,解决部分异构数据融合问题;第二,通过短文本的三元组提取能够将短文本中的信息提取出来,实现文本的信息抽提,解决大文本存储和利用较难的问题;第三,通过将各类环境数据和知识图谱相结合,并利用前端展示技术提供的展示界面,可以直观获得各类环境信息,为环境决策提供决策依据。
杜文星[10](2020)在《基于知识图谱的伪装方案规划系统》文中研究指明知识图谱技术是人工智能技术的重要组成部分,自2012年由谷歌公司提出之后,目前已经应用于智能搜索、智能问答、个性化推荐、电商、用户画像等多个领域。在军事领域,随着战场信息的爆炸式增长,传统的信息处理技术已经无法满足军队现代化、信息化的发展要求,而知识图谱技术由于其优秀的知识查询能力以及知识扩展能力,正逐渐取代传统知识库,在越来越多的领域发挥着重要作用。在军事伪装领域,本文基于专业伪装知识构建了一个军事伪装知识图谱,并在此基础上实现了一个方案规划系统,用于针对特定伪装目标,自动化生成伪装方案措施。在结构安排上,本文首先介绍了课题的背景与相关技术,并简单说明了课题的总体流程与安排;接着详细介绍了军事伪装知识图谱本体层的构建过程;在此基础上,本文详细介绍了军事伪装知识图谱数据层的构建原理与过程;最后,本文详细描述了伪装方案规划系统基于军事伪装知识图谱的实现方法。
二、半结构数据中的结构推理(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、半结构数据中的结构推理(论文提纲范文)
(1)知识图谱在海洋领域的应用及前景分析综述(论文提纲范文)
1 海洋领域知识图谱研究进展 |
1.1 海洋领域文献的可视化分析 |
1.1.1 CiteSpace |
1.1.2 VOSviewer |
1.1.3 Ucinet |
1.1.4 海洋文献的可视化分析演变 |
1.2 海洋领域垂直图谱构建 |
1.2.1 针对海洋领域非结构化数据的抽取 |
(1)命名实体识别 |
(1)基于规则 |
(2)基于统计模型 |
(3)基于深度学习 |
(4)海洋领域命名实体识别难点及技术分析 |
(2)关系抽取 |
(1)手工模板匹配 |
(2)基于监督学习 |
(3)基于弱监督学习 |
(2)海洋领域关系抽取难点及技术分析 |
(3)事件抽取 |
(1)基本模型 |
(2)混合处理模型 |
(3)海洋领域事件抽取难点及技术分析 |
1.2.2 针对海洋领域半结构化数据的抽取 |
(1)百科类数据抽取 |
(2)Web页面数据抽取 |
1.2.3知识融合 |
(1)实体链接 |
(1)指称识别与备选实体生成 |
(2)备选实体消歧 |
(3)海洋领域实体链接难点及技术分析 |
(2)知识合并 |
(1)合并外部数据库 |
(2)合并关系数据库 |
1.2.4 知识图谱推理 |
(1)传统方法 |
(2)几何运算法 |
(3)深度学习法 |
(4)海洋领域知识图谱推理的难点 |
2 海洋与图谱结合应用 |
2.1 实例 |
2.2 前景 |
3 结论 |
(2)面向医院管理的数据驱动决策研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 数据驱动决策的研究现状 |
1.3.2 数据驱动医疗健康领域决策的研究现状 |
1.3.3 数据驱动医院管理决策的研究现状 |
1.3.4 数据驱动决策的影响因素研究现状 |
1.3.5 研究现状述评 |
1.4 研究框架与研究内容 |
1.4.1 研究框架 |
1.4.2 主要研究内容 |
1.4.3 拟解决的关键问题 |
1.5 研究方法和技术路线 |
1.5.1 研究方法 |
1.5.2 技术路线 |
第2章 相关基础理论和方法 |
2.1 医院管理相关概念 |
2.1.1 医院管理 |
2.1.2 医院管理评价 |
2.1.3 医院管理者 |
2.2 决策支持相关理论 |
2.2.1 西蒙决策理论 |
2.2.2 数据驱动决策相关理论 |
2.3 信息链理论 |
2.3.1 信息链与信息技术 |
2.3.2 “信息”上溯到“数据”带来的变化 |
2.3.3 信息链视域下的数据驱动医院管理决策 |
2.4 BASM模型 |
2.4.1 BASM模型的产生 |
2.4.2 BASM模型的研究现状 |
2.4.3 基于BASM模型的数据驱动医院管理决策研究 |
2.5 相关研究方法 |
2.5.1 扎根理论 |
2.5.2 结构方程模型 |
2.5.3 决策树算法--CHAID |
2.6 相关应用场景 |
2.6.1 医疗服务绩效 |
2.6.2 DRG在医疗服务绩效管理中的应用 |
2.7 本章小结 |
第3章 面向医院管理的数据驱动决策过程模型构建 |
3.1 面向医院管理决策的数据驱动过程模型 |
3.1.1 数据驱动决策模式运行机制 |
3.1.2 BASM的过程模型 |
3.1.3 基于BASM过程模型的数据驱动医院管理决策过程模型构建 |
3.2 面向医院管理的数据驱动决策过程模型要素分析 |
3.2.1 驱动要素 |
3.2.2 需求要素 |
3.2.3 支持要素 |
3.2.4 要素间关系 |
3.3 数据驱动的医院管理决策中数据处理过程 |
3.3.1 医疗数据存在的问题 |
3.3.2 面向医院管理决策的数据处理原则 |
3.3.3 面向医院管理决策的数据处理过程 |
3.4 面向医院管理的数据驱动决策过程模型运行机制 |
3.4.1 面向医院管理决策的信息链转化过程 |
3.4.2 数据驱动的医院管理决策制定过程 |
3.5 本章小结 |
第4章 基于扎根理论的数据驱动医院管理决策的影响因素分析 |
4.1 研究问题与研究程序 |
4.1.1 研究问题 |
4.1.2 研究方法 |
4.1.3 研究程序 |
4.2 研究设计 |
4.2.1 研究对象选取 |
4.2.2 资料收集 |
4.2.3 信效度检验 |
4.3 编码分析 |
4.3.1 开放式编码 |
4.3.2 主轴编码 |
4.3.3 选择性编码 |
4.3.4 理论饱和度检验 |
4.4 数据驱动医院管理决策影响因素理论模型与阐释 |
4.4.1 影响因素理论模型构建 |
4.4.2 影响因素分析 |
4.4.3 影响因素关系分析 |
4.5 本章小结 |
第5章 数据驱动医院管理决策的影响因素模型构建 |
5.1 数据驱动医院管理决策影响因素变量选择与界定 |
5.1.1 医疗数据质量维度 |
5.1.2 信息技术维度 |
5.1.3 医院组织管理维度 |
5.1.4 管理者信息素养维度 |
5.1.5 数据驱动医院管理决策维度 |
5.2 相关研究假设 |
5.2.1 医疗数据质量 |
5.2.2 信息技术 |
5.2.3 医院组织管理 |
5.2.4 管理者信息素养 |
5.3 调查问卷的编制与问卷修正 |
5.4 数据获取与统计分析 |
5.4.1 研究对象 |
5.4.2 样本量的选择 |
5.4.3 信度分析 |
5.4.4 样本分布 |
5.4.5 样本数据相关性 |
5.5 效度分析 |
5.5.1 探索性因子分析 |
5.5.2 验证性因子分析 |
5.6 基于结构方程的影响因素模型构建与检验修正 |
5.6.1 影响因素模型构建 |
5.6.2 模型基本适配评估 |
5.6.3 假设检验的结果 |
5.7 结构方程模型检验结果分析 |
5.7.1 影响因素强度分析 |
5.7.2 医疗数据质量对信息技术影响的验证结果分析 |
5.7.3 信息技术对数据驱动医院管理决策影响的验证结果分析 |
5.7.4 医院组织管理对医疗数据质量影响的验证结果分析 |
5.7.5 医院组织管理对管理者信息素养影响的验证结果分析 |
5.7.6 医院组织管理对数据驱动医院管理决策影响的验证结果分析 |
5.7.7 管理者信息素养对医疗数据质量影响的验证结果分析 |
5.7.8 管理者信息素养对信息技术影响的验证结果分析 |
5.7.9 管理者信息素养对数据驱动医院管理决策影响的验证结果分析 |
5.8 本章小结 |
第6章 面向医院管理的数据驱动决策模型研究 |
6.1 数据驱动医院管理决策模型构建 |
6.2 面向医院管理的数据驱动决策模型的驱动机制 |
6.2.1 面向医院管理的数据驱动决策模型的驱动目标 |
6.2.2 面向医院管理的数据驱动决策模型的驱动特征 |
6.2.3 面向医院管理的数据驱动决策模型的驱动过程 |
6.3 数据驱动医院管理决策模型影响因素的作用机制 |
6.3.1 医疗数据质量在数据驱动决策模型中的影响机制 |
6.3.2 信息技术在数据驱动决策模型中的影响机制 |
6.3.3 医院组织管理在数据驱动决策模型中的影响机制 |
6.3.4 管理人员素养在数据驱动决策模型中的影响机制 |
6.4 数据驱动医院管理决策模型对医院管理的提升策略 |
6.4.1 提升医疗数据质量 |
6.4.2 发挥信息技术使能作用 |
6.4.3 发挥医院组织管理支持作用 |
6.4.4 提高管理人员信息素养 |
6.5 本章小结 |
第7章 面向医院管理的数据驱动决策的实证研究 |
7.1 资料来源与研究对象 |
7.2 原发性肺癌患者的DRGS分组 |
7.2.1 数据基础 |
7.2.2 数据纳入 |
7.2.3 术语映射 |
7.2.4 DRGs分组结果对比 |
7.3 基于DRGS细分组的医疗服务绩效评估 |
7.3.1 基于决策树的原发性肺癌患者DRGs细分组模型 |
7.3.2 基于DRGs细分组的医疗服务绩效评估指标 |
7.3.3 医生医疗服务绩效指标统计结果 |
7.3.4 科室医疗服务绩效指标统计结果 |
7.4 讨论 |
7.4.1 数据驱动医院管理决策过程 |
7.4.2 数据驱动医院管理决策影响因素 |
7.5 本章小结 |
第8章 结论与创新 |
8.1 结论 |
8.2 研究创新点 |
8.3 研究局限 |
参考文献 |
附录1 病案组DRGS分组情况 |
附录2 医生组DRGS分组情况 |
附录3 访谈提纲 |
附录4 调查问卷 |
作者简介及在学期间所取得的科研成果 |
后记与致谢 |
(3)基于多源异构数据的地方风土人情知识图谱构建方法及应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 知识图谱相关研究现状 |
1.2.1 知识图谱研究现状 |
1.2.2 知识图谱问答系统研究现状 |
1.2.3 发展趋势 |
1.3 研究内容和章节安排 |
1.3.1 研究内容 |
1.3.2 章节安排 |
第二章 相关概念与理论基础 |
2.1 本体 |
2.1.1 本体概念 |
2.1.2 本体语言 |
2.2 命名实体识别与实体关系抽取 |
2.2.1 命名实体识别 |
2.2.2 实体关系抽取 |
2.3 主要开发工具 |
2.3.1 Neo4j |
2.3.2 Protégé |
2.4 本章小结 |
第三章 基于多源异构数据的地方风土人情知识图谱构建方法 |
3.1 地方风土人情知识图谱本体构建 |
3.1.1 传统本体建模方法 |
3.1.2 风土人情领域本体构建方法 |
3.2 知识来源分析与搜集 |
3.3 基于结构化数据的三元组抽取 |
3.4 基于百度百科的知识抽取 |
3.4.1 实体属性类知识爬取 |
3.4.2 实体图片爬取 |
3.5 文本三元组抽取 |
3.5.1 基于纸质书籍的文本预处理与训练语料制作方法 |
3.5.2 实体关系联合抽取模型 |
3.6 知识融合 |
3.7 基于Neo4j的知识图谱存储 |
3.8 实体关系联合抽取实验 |
3.8.1 实验数据与参数设置 |
3.8.2 评价指标 |
3.8.3 实验对比与结果分析 |
3.9 本章小结 |
第四章 基于知识图谱的问答方法 |
4.1 知识图谱问答方法整体设计 |
4.2 实体提及识别方法 |
4.2.1 原实体提及识别方法 |
4.2.2 基于BERT的半指针半标注网络 |
4.3 基于规则的问句属性抽取 |
4.4 实体链接与候选路径生成 |
4.4.1 实体链接 |
4.4.2 候选路径生成 |
4.5 基于BERT的问句与候选查询路径的匹配 |
4.6 桥接与查询路径筛选 |
4.6.1 桥接 |
4.6.2 查询路径筛选 |
4.7 实验设计与结果评估 |
4.7.1 实验数据与参数设置 |
4.7.2 评价指标 |
4.7.3 实体提及识别实验 |
4.7.4 问答模型实验结果 |
4.8 本章小结 |
第五章 内蒙古风土人情问答系统开发与实现 |
5.1 需求分析 |
5.1.1 系统设计目的 |
5.1.2 系统功能需求 |
5.1.3 系统性能需求 |
5.2 系统设计与实现 |
5.2.1 系统总体框架设计与实现 |
5.2.2 系统技术框架设计 |
5.3 系统关键功能设计与实现 |
5.4 问答功能测试与分析 |
5.5 本章小结 |
结论 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文及取得的科研成果 |
(4)基于知识图谱的食品对话系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 本文组织结构 |
第二章 基础知识 |
2.1 知识图谱概念与构建 |
2.1.1 知识图谱概念 |
2.1.2 知识图谱构建 |
2.2 词向量表示 |
2.2.1 One-Hot表示 |
2.2.2 分布式表示 |
2.3 相关模型 |
2.3.1 BERT模型 |
2.3.2 BiLSTM模型 |
2.3.3 CRF模型 |
2.4 本章小结 |
第三章 食品知识图谱构建 |
3.1 领域知识图谱构建方法 |
3.2 食品知识图谱的设计 |
3.3 食品知识图谱的构建 |
3.3.1 数据准备 |
3.3.2 关系抽取 |
3.3.3 实体对齐 |
3.3.4 知识存储 |
3.3.5 构建结果 |
3.4 本章小结 |
第四章 食品关系抽取与实体对齐 |
4.1 关系抽取 |
4.1.1 规则匹配方法 |
4.1.2 深度学习方法 |
4.2 实体对齐 |
4.2.1 构造别名词表 |
4.2.2 综合评分方法 |
4.2.3 分类算法 |
4.3 本章小结 |
第五章 食品对话系统设计与实现 |
5.1 需求分析 |
5.1.1 功能性需求 |
5.1.2 非功能能需求 |
5.1.3 对话流程 |
5.2 开发环境 |
5.3 结构设计 |
5.4 功能模块 |
5.4.1 用户层 |
5.4.2 逻辑层 |
5.4.3 数据层 |
5.5 系统测试 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 后续工作展望 |
参考文献 |
致谢 |
攻读学位期间取得的研究成果 |
(5)基于深度学习的垂直领域知识图谱构建方法研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 知识图谱构建技术 |
1.2.2 通用知识图谱构建 |
1.2.3 垂直领域知识图谱构建 |
1.3 本文研究内容 |
1.4 本文结构安排 |
第二章 相关技术研究 |
2.1 知识图谱定义及架构 |
2.2 知识表示 |
2.2.1 语义网表示 |
2.2.2 表示学习 |
2.2.2.1 距离模型 |
2.2.2.2 单层神经网络模型 |
2.2.2.3 张量神经网络模型 |
2.2.2.4 翻译模型 |
2.3 知识抽取 |
2.3.1 实体抽取 |
2.3.1.1 基于规则的方法 |
2.3.1.2 基于统计学习的方法 |
2.3.2 关系抽取 |
2.3.2.1 基于规则的方法 |
2.3.2.2 基于机器学习的方法 |
2.3.2.3 基于深度学习的方法 |
2.4 深度学习 |
2.4.1 卷积神经网络 |
2.4.1.1 基本概念 |
2.4.1.2 CNN在自然语言处理领域中的应用 |
2.4.2 BERT |
2.5 文本增强 |
2.5.1 无条件增强 |
2.5.1.1 词汇替代 |
2.5.1.2 引入随机噪声 |
2.5.1.3 混合和交叉增强 |
2.5.2 条件增强 |
2.5.2.1 深度生成模型 |
2.5.2.2 条件预训练语言模型 |
2.6 本章小结 |
第三章 半结构化数据知识抽取算法的研究与实现 |
3.1 行业知识抽取数据集 |
3.1.1 数据预处理 |
3.1.2 基于数据标注平台的基础数据标注 |
3.1.3 基于词典和实例交叉的增强数据生成算法 |
3.2 半结构化数据的知识抽取算法Bi-LSTM-CRF-SSG |
3.2.1 表格子模式层标注 |
3.2.2 基于子模式生成的表格知识抽取算法SSG |
3.3 本章小结 |
第四章 非结构化数据知识抽取算法的研究与实现 |
4.1 基于膨胀门卷积神经网络和概率图的联合实体关系抽取算法 |
4.1.1 概率图思想 |
4.1.2 字词混合嵌入 |
4.1.3 位置嵌入 |
4.1.4 膨胀门卷积神经网络(DGCNN) |
4.2 基于BERT迁移学习的管道实体关系抽取算法 |
4.2.1 BERT的微调 |
4.2.2 关系分类模型 |
4.2.3 主语宾语标注模型 |
4.3 基于BERT和概率图模型的联合实体关系抽取算法BERT-PGM |
4.4 本章小结 |
第五章 垂直领域知识图谱自动构建系统实现与测试 |
5.1 方案设计 |
5.2 系统实现 |
5.2.1 离线部分 |
5.2.1.1 模式层设计模块实现 |
5.2.2 在线部分 |
5.2.2.1 前端模块实现 |
5.2.2.2 后台模块实现 |
5.3 系统测试 |
5.3.1 测试环境 |
5.3.1.1 硬件环境 |
5.3.1.2 软件环境 |
5.3.2 抽取算法实验与分析 |
5.3.2.1 半结构化数据知识抽取准确性实验 |
5.3.2.2 非结构化数据知识抽取准确性实验 |
5.3.2.3 抽取结果问答应用实验 |
5.3.3 系统的功能测试 |
5.3.3.1 单文档抽取 |
5.3.3.2 多文档抽取 |
5.3.3.3 增量抽取 |
5.3.4 系统的性能测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(6)面向科技咨询的知识图谱构建与管理平台的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景和意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状及分析 |
1.2.1 领域知识图谱构建技术研究现状 |
1.2.2 领域知识图谱构建平台研究现状 |
1.2.3 国内外研究现状小结 |
1.3 主要研究内容及创新点 |
1.4 硕士在读期间主要工作 |
1.5 论文组织结构 |
第二章 相关理论与技术研究 |
2.1 统一信息模型相关研究 |
2.1.1 共享信息与数据模型理论 |
2.1.2 元数据定义理论 |
2.1.3 数据中台理论 |
2.2 领域知识图谱构建相关技术 |
2.2.1 领域数据资源获取方法 |
2.2.2 概念图谱构建技术 |
2.2.3 知识抽取技术 |
2.2.4 知识融合技术 |
2.2.5 知识图谱可视化技术 |
2.2.6 图存储技术 |
2.3 本章小结 |
第三章 科技咨询大数据统一信息模型的设计实现 |
3.1 研究挑战 |
3.2 科技咨询大数据统一信息模型的设计方法 |
3.2.1 全域数据层次化定义 |
3.2.2 全域数据关联化组织 |
3.2.3 统一信息模型的图谱化 |
3.3 本章小结 |
第四章 领域知识图谱本体和数据的构建方法研究 |
4.1 研究挑战 |
4.2 领域知识图谱本体和数据的构建方法 |
4.2.1 大数据平台、AI开放平台、领域知识图谱构建工具的松耦合支撑模式 |
4.2.2 自顶向下为主、自底向上为辅的领域知识图谱本体和数据构建流程 |
4.2.3 多层级标签体系的领域知识图谱模式约束方法 |
4.2.4 自底向上数据驱动的知识获取方法 |
4.3 本章小结 |
第五章 面向科技咨询的知识图谱构建与管理平台的设计与实现 |
5.1 面向科技咨询的知识图谱构建与管理平台需求分析 |
5.1.1 平台业务需求 |
5.1.2 平台功能需求 |
5.2 面向科技咨询的知识图谱构建与管理平台总体设计 |
5.2.1 平台整体架构设计 |
5.2.2 平台功能及流程设计 |
5.3 数据库设计 |
5.4 核心功能模块设计与开发实现 |
5.4.1 数据资源管理子系统 |
5.4.2 图谱本体建模子系统 |
5.4.3 知识图谱构建子系统 |
5.4.4 知识图谱应用子系统 |
5.5 本章小结 |
第六章 面向科技咨询的知识图谱构建与管理平台的部署与测试 |
6.1 平台环境部署 |
6.2 平台核心功能测试 |
6.2.1 爬虫配置功能测试 |
6.2.2 图谱本体建模功能测试 |
6.2.3 知识图谱构建功能测试 |
6.2.4 知识图谱应用功能测试 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间取得的研究成果 |
(7)地震灾害防治信息智能匹配算法研究(论文提纲范文)
摘要 |
Abstract |
1.绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 知识图谱研究现状 |
1.2.2 语义匹配算法研究现状 |
1.3 研究目标与研究内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.4 章节安排 |
2.相关理论与方法概述 |
2.1 语料库构建流程介绍 |
2.1.1 文本预处理 |
2.1.2 语料标注 |
2.2 知识图谱构建相关技术 |
2.2.1 知识建模 |
2.2.2 知识抽取技术 |
2.2.3 知识融合 |
2.2.4 知识推理 |
2.3 语义匹配技术 |
2.3.1 卷积神经网络 |
2.3.2 注意力机制 |
2.3.3 文本预训练模型 |
3.地震灾害防治语料库构建及语料标注 |
3.1 地震灾害防治语料库设计 |
3.2 地震灾害防治语料收集及预处理 |
3.2.1 语料收集 |
3.2.2 语料库的加工处理 |
3.3 词典分析与语料标注 |
3.3.1 领域词典构建 |
3.3.2 地震灾害语料序列标注 |
3.4 本章小结 |
4.基于场景的地震灾害防治知识图谱构建 |
4.1 地震灾害防治知识图谱体系设计 |
4.1.1 地震灾害防治知识图谱构建流程设计 |
4.1.2 地震灾害防治领域特征分析 |
4.2 基于场景的地震灾害防治本体设计 |
4.2.1 地震领域理论本体 |
4.2.2 防震减灾策略本体 |
4.2.3 地震信息服务功能本体 |
4.2.4 地震灾害数据本体 |
4.3 地震灾害防治知识图谱构建 |
4.3.1 基于本体的模式层设计与构建 |
4.3.2 数据层设计与构建 |
4.3.3 地震灾害防治知识图谱展示 |
4.4 本章小结 |
5.语义匹配算法设计和实验验证 |
5.1 语义匹配算法的设计 |
5.1.1 用户需求预处理 |
5.1.2 意图识别 |
5.1.3 匹配结果生成 |
5.2 语义匹配算法的程序结构 |
5.3 地震灾害防治信息服务的案例实验 |
5.3.1 实验环境和实验数据 |
5.3.2 实验内容 |
5.4 本章小结 |
6.总结和展望 |
6.1 本文总结 |
6.2 未来展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(8)高速铁路安全文本大数据分析方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 高速铁路安全文本特征及价值分析 |
1.2.1 高速铁路安全文本特征分析 |
1.2.2 高速铁路安全文本价值分析 |
1.3 国内外研究现状 |
1.3.1 文本大数据分析研究现状 |
1.3.2 铁路安全文本数据分析研究现状 |
1.4 主要研究内容与技术路线 |
1.4.1 主要研究内容 |
1.4.2 技术路线 |
1.5 组织结构 |
1.6 本章小结 |
2 高速铁路安全文本大数据分析理论基础 |
2.1 文本大数据分析 |
2.2 知识图谱构建理论 |
2.2.1 知识图谱 |
2.2.2 文本分类 |
2.2.3 命名实体识别 |
2.2.4 实体关系抽取 |
2.2.5 实体对齐 |
2.3 高速铁路安全知识图谱构建与应用架构 |
2.3.1 高速铁路安全知识图谱构建方法 |
2.3.2 高速铁路安全知识图谱应用功能 |
2.4 高速铁路安全文本分析核心方法 |
2.5 本章小结 |
3 基于深度学习集成的高速铁路设备故障分类方法 |
3.1 基于深度学习集成的设备故障分类模型 |
3.1.1 基于ADASYN的少类别样本生成 |
3.1.2 基于铁路专业词库的中文分词方法 |
3.1.3 高速铁路设备故障文本特征表示 |
3.1.4 深度学习集成的故障分类模型 |
3.2 高速铁路信号道岔设备故障数据分析 |
3.2.1 信号道岔设备故障数据 |
3.2.2 信号道岔故障数据的不平衡性 |
3.3 实验验证与结果分析 |
3.3.1 文本分类性能评估 |
3.3.2 道岔设备故障少类别样本生成实验 |
3.3.3 基于深度学习集成故障分类模型实验分析 |
3.3.4 实验总结 |
3.4 本章小结 |
4 高速铁路设备故障命名实体与实体关系抽取方法 |
4.1 设备故障命名实体与关系抽取模型总体框架 |
4.2 高速铁路设备故障命名实体与实体关系定义 |
4.3 高速铁路设备故障命名实体与实体关系标注 |
4.4 高速铁路设备故障命名实体与实体关系特征表示 |
4.4.1 基于多维字符特征的命名实体特征表示 |
4.4.2 基于多维分词表示的实体关系特征表示 |
4.5 高速铁路设备故障命名实体与实体关系抽取模型 |
4.5.1 基于BiLSTM+CRF的设备故障命名实体识别 |
4.5.2 基于Transformer的设备故障实体关系抽取 |
4.6 实验验证与结果分析 |
4.6.1 基于多维字符特征表示的BiLSTM+CRF命名实体识别模型验证 |
4.6.2 基于多维分词表示的Transformer关系抽取模型验证 |
4.6.3 实体和关系联合抽取模型实验分析 |
4.6.4 实验总结 |
4.7 本章小结 |
5 基于概念相似度的高速铁路设备故障实体对齐方法 |
5.1 概念相似度计算原理 |
5.1.1 未登录词处理过程 |
5.1.2 概念相似度计算过程 |
5.2 基于概念相似度计算的设备故障命名实体对齐 |
5.2.1 设备故障实体词汇抽取过程 |
5.2.2 设备故障实体概念相似度计算过程 |
5.2.3 设备故障实体对齐过程 |
5.3 实验结果 |
5.4 高速铁路设备故障知识图谱维护与更新 |
5.4.1 设备故障知识图谱维护 |
5.4.2 设备故障知识图谱更新 |
5.5 本章小结 |
6 高速铁路安全文本大数据平台设计与实现 |
6.1 高速铁路安全文本大数据平台总体设计 |
6.1.1 高速铁路安全文本大数据平台总体架构 |
6.1.2 高速铁路安全文本大数据平台技术架构 |
6.1.3 高速铁路安全文本大数据平台功能架构 |
6.2 高速铁路安全文本分析业务流程设计 |
6.3 高速铁路安全文本分析模型交互设计 |
6.3.1 动态交互标注模型设计 |
6.3.2 模型推荐设计 |
6.4 高速铁路安全文本大数据平台功能展示 |
6.4.1 样本标注任务创建与管理 |
6.4.2 样本数据标注 |
6.4.3 文本分析模型管理 |
6.4.4 文本分析模型应用 |
6.4.5 文本分析模型API管理 |
6.5 高速铁路信号设备故障文本分析应用案例 |
6.5.1 高速铁路信号故障数据特征分析 |
6.5.2 高速铁路信号设备故障知识图谱构建与应用 |
6.5.3 高速铁路信号设备故障文本分析实现 |
6.5.4 高速铁路信号设备故障知识图谱展示 |
6.6 本章小结 |
7 结论与展望 |
7.1 结论 |
7.2 展望 |
参考文献 |
索引 |
作者简历及科研成果 |
学位论文数据集 |
(9)环境大数据异构信息融合方法研究(论文提纲范文)
中文摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外相关研究综述 |
1.2.1 信息融合方法 |
1.2.2 知识图谱 |
1.2.3 基于本体的知识图谱构建方法 |
1.3 主要研究内容 |
1.4 论文的组织结构 |
第二章 信息融合相关概念与理论 |
2.1 信息融合相关概念和理论 |
2.1.1 大数据时代数据的新特性 |
2.1.2 融合理论发展 |
2.1.3 信息融合的关键技术 |
2.1.4 信息融合的应用 |
2.1.5 存在问题及发展趋势 |
2.2 知识图谱相关研究 |
2.2.1 知识图谱的起源与发展 |
2.2.2 知识图谱的基本定义 |
2.2.3 知识图谱的主要技术 |
2.2.4 知识图谱的相关应用 |
2.3 本章小结 |
第三章 基于本体的环境信息领域知识图谱构建 |
3.1 环境数据获取 |
3.1.1 环境信息数据现状及特点 |
3.1.2 环境信息数据获取 |
3.1.3 数据预处理 |
3.2 短文本三元组的抽取 |
3.3 环境信息领域知识图谱的构建与设计 |
3.3.1 知识图谱构建流程 |
3.3.2 概念层和实例层的构建 |
3.4 基于Neo4j的环境知识存储 |
3.4.1 图数据库Neo4j |
3.4.2 环境数据知识存储 |
3.5 本章小结 |
第四章 基于知识图谱的环境数据管理原型系统 |
4.1 需求分析 |
4.2 系统设计 |
4.3 系统开发环境 |
4.4 系统实现 |
4.4.1 异构数据管理模块 |
4.4.2 实体关系管理模块 |
4.4.3 知识图谱展示模块 |
4.4.4 用户权限管理模块 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
攻读硕士期间取得的研究成果 |
(10)基于知识图谱的伪装方案规划系统(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景与意义 |
1.2 相关技术概述 |
1.2.1 知识图谱的定义 |
1.2.2 知识图谱的表示 |
1.2.3 知识图谱的架构 |
1.2.4 知识抽取技术 |
1.2.5 知识融合技术 |
1.2.6 实体消歧技术 |
1.2.7 知识推理技术 |
1.3 本文的主要工作和结构安排 |
1.4 本章小结 |
第2章 基于伪装知识图谱的方案规划系统设计 |
2.1 问题描述 |
2.2 总体流程 |
2.3 本章小结 |
第3章 伪装知识图谱的本体层构建方案 |
3.1 方案概述 |
3.2 本体层的构建原则 |
3.2.1 业务原则 |
3.2.2 效率原则 |
3.3 基于Protege的本体层构建 |
3.3.1 Protege简介 |
3.3.2 本体的定义 |
3.3.3 本体关系的定义 |
3.4 本章小结 |
第4章 伪装知识图谱的数据层构建方案 |
4.1 方案概述 |
4.2 半结构化数据向结构化数据的转化 |
4.2.1 属性指称项词典的构建 |
4.2.2 属性指称项的统一 |
4.3 非结构化数据向结构化数据的转化 |
4.3.1 基于ON-BiLSTM+CRF的实体抽取 |
4.3.2 基于PCNN的关系抽取与属性抽取 |
4.4 利用D2RQ完成结构化数据向数据层的自动映射 |
4.4.1 D2RQ简介 |
4.4.2 结构化数据向数据层的自动映射 |
4.5 本章小结 |
第5章 方案规划系统的实现方案 |
5.1 方案概述 |
5.2 基于Jena推理机的隐含知识挖掘 |
5.2.1 Jena简介 |
5.2.2 隐含知识挖掘 |
5.3 方案规划系统的具体实现 |
5.3.1 规则模板的定义 |
5.3.2 演示案例 |
5.4 方案规划系统的运行性能与效率 |
5.5 本章小结 |
第6章 总结和展望 |
6.1 本文工作总结 |
6.2 展望 |
参考文献 |
作者简历 |
致谢 |
四、半结构数据中的结构推理(论文参考文献)
- [1]知识图谱在海洋领域的应用及前景分析综述[J]. 熊中敏,马海宇,李帅,张娜. 计算机工程与应用, 2022(03)
- [2]面向医院管理的数据驱动决策研究[D]. 李茵. 吉林大学, 2021(01)
- [3]基于多源异构数据的地方风土人情知识图谱构建方法及应用研究[D]. 蔡新辉. 内蒙古工业大学, 2021(01)
- [4]基于知识图谱的食品对话系统的设计与实现[D]. 马志明. 北京邮电大学, 2021(01)
- [5]基于深度学习的垂直领域知识图谱构建方法研究与实现[D]. 杨小敏. 北京邮电大学, 2021(01)
- [6]面向科技咨询的知识图谱构建与管理平台的设计与实现[D]. 马超童. 北京邮电大学, 2021(01)
- [7]地震灾害防治信息智能匹配算法研究[D]. 谢炎宏. 兰州交通大学, 2021(01)
- [8]高速铁路安全文本大数据分析方法研究[D]. 李新琴. 中国铁道科学研究院, 2020
- [9]环境大数据异构信息融合方法研究[D]. 宋伟. 太原科技大学, 2020(05)
- [10]基于知识图谱的伪装方案规划系统[D]. 杜文星. 浙江大学, 2020(02)