语料库语言学及其应用

一、语料语言学及其应用（论文文献综述）

刘欣^[1]（2021）在《语句意图匹配方法研究》文中提出语句意图匹配方法是自动问答和信息检索等系统的核心技术,主要用于判断两个语句中的语义意图匹配程度,在实际应用中具有重要价值。近几年随着深度学习的兴起,相关方面研究获得了突破性进展。尽管深度学习方法在语句意图匹配中得到广泛应用,其仍然面临以下挑战:1)训练样本不足的问题,很多实际应用领域难以提供足够的训练样本;2)由于语句表达的灵活多变,模型对语句中意图信息的有效编码受到一定限制;3)词语语义的多义性在现有的模型中没有得到足够的重视,限制模型性能的进一步提升;4)特定应用场景下参与匹配的语句关系复杂,使得特定场景下通用意图匹配方法无法有效适用。本文主要针对以上问题开展研究,主要内容包括以下几个方面:第一,针对训练样本不足的问题,提出基于无监督方法的问句意图匹配语料的构建方法。在语料的构建过程中,本文首先使用搜索引擎收集大规模的多领域问句对;其次,使用无监督距离算法过滤不相关的问句对;最后,具有专业背景的数据标注者对剩余的问句对进行意图是否匹配的人工标注,得到包含260 068个问句对的问句意图匹配语料。同时,本文将语料划分成训练集,验证集和测试集并使用已发布的的语句意图匹配算法进行实验,实验结果不仅证明了本文方法构建的大规模中文问句意图匹配语料的良好质量,而且还提供了可靠的基线性能以进一步研究该语料。第二,针对模型难以对语句中意图信息进行有效编码问题,提出基于语句差异性特征的匹配方法。该方法首先将语句对中的差异词汇抽取出来,其次使用神经语言模型对差异词汇进行编码,得到语句差异性特征,最后通过门控机制将语句差异性特征整合到基准意图匹配方法中。在国际开放的大规模中文问句意图匹配语料和英文问句意图匹配语料上进行实验。实验结果表明,本文提出的方法可以有效地学习到语句中的意图差异性信息并提升意图匹配性能,在各类评价指标上均优于已发表的基线意图匹配方法。第三,针对词语语义信息表示存在多义性的问题,提出了面向意图匹配的词向量分解词义学习方法。该方法首先将语句中的一个多义词转换为词向量表示,并使用胶囊神经网络对词向量进行分解得到多个类义素向量。其次,使用神经语言模型对语句进行上下文编码得到上下文信息表示。最后,使用注意力机制将上下文信息表示与多个类义素向量进行注意力整合,生成特定上下文的词义向量。本文将学习到的词义向量应用到英文问句意图匹配语料上进行验证,实验结果表明,相比于无监督词向量,该方法学到的词义向量能够更准确地捕捉到词语的语义,从而进一步提升意图匹配模型的性能。第四,针对通用意图匹配方法在特定场景下的匹配语句中性能受限问题,提出基于意图的领域内知识与文本匹配方法。该方法基于医学知识和医学文本中的意图信息,使用关系和主题胶囊网络,分别对医学知识中的关系特征和医学文献中的主题特征进行学习,并将学到的关系和主题特征作为意图信息融入到匹配算法中。在医学文献检索任务上使用人工标注的匹配数据集和排序数据集对该方法进行验证。实验结果表明,在各项评价指标上,该方法均优于已公开的不同类型基线方法。证明了医学知识和医学文本匹配语句中包含有效意图匹配信息,并且这些信息可以通过该方法融入到通用匹配模型中,进一步增强模型在医学信息检索中的匹配性能。综上所述,本文围绕语句意图匹配方法进行深入研究和讨论,针对意图匹配方法中存在的四个问题,分别提出意图匹配数据构建方法,基于语句差异性特征的匹配方法,面向意图匹配的词向量分解词义学习方法和基于意图的领域内知识与医学文本匹配方法。通过大量实验,在各自对应的数据集上进行验证,最终均取得了较优性能。

林丽^[2]（2020）在《基于语料库的近代汉语“甚类词”研究》文中认为近代汉语是汉语史中承上启下的重要时期,“甚类词”是程度副词中数量铰多的小类。本文借助大型标记语料库,运用语料库语言学的理论和方法,考察近代汉语“甚类词”的共时面貌和历时演变。利用构式搭配分析方法,研究近代汉语“甚类词”的搭配能力。在此基础上,分析不同“甚类词”的异同。除“绪论”和“结语”外,论文共分四章。“绪论”部分介绍“甚类词”的研究现状、研究目的和意义,语料库语言学的研究对象和方法,同时说明本文的语料来源和研究方法。第一章描写近代汉语“甚类词”的总体面貌特征。首先介绍“甚类词”在近代汉语共时平面的语言特征,并与上古汉语和中古汉语“甚类词”作历时比较,发现近代汉语的“甚类词”是一个具有历史层次的系统,既有对上古、中古汉语“甚类词”的继承和沿用,又有创新和发展。第二章介绍近代汉语“甚类词”的句法搭配特征。从组合功能上看,“甚类词”可以与形容词性结构、动词性结构、主谓结构、状中短语和少数名词性结构等进行搭配;从句法功能上看,近代汉语“甚类词”有着其他类别程度副词的共性,作状语,同时也有其自身的特点,可以作补语;从音节选择上看,近代汉语“甚类词”根据自身音节的特点对搭配词的音节数量也有不同的要求;在句式选择上,大部分“甚类词”都可以用于肯定式,部分成员既可以用于肯定形式也可以用于否定形式,部分成员只能用于肯定式之中。第三章利用构式搭配分析法考察近代汉语“甚类词”的异同。首先介绍构式搭配的研究目的和方法以及如何收集提取数据。利用这些数据,根据不同“甚类词”的搭配特征对它们进行聚类分析,总结出不同成员之间的相似程度。同时利用多项特异共现词位分析方法,根据“甚类词”搭配的不同词语,考察“甚类词”之间在特异词数量和特异词词类上的差异。最后利用对应分析将“甚类词”作可视化处理,利用二维图的形式直观地将近代汉语“甚类词”构式之间的差异呈现出来。第四章对“这+X”“那+X”“恁+X”等指示表程度的词进行个案分析,考察这类词的来源、演变过程和用法。“结语”部分总结本文所做的工作和取得的成绩,并对汉语语料库语言学研究中存在的问题进行反思。

杜燕航,田文杰,屈轶^[3]（2020）在《语料库辅助下的外军留学生课堂口译研究》文中进行了进一步梳理党的十八大以来,在习近平强军思想指引下,我军的外训工作步入新阶段,外军留学生课堂口译的重要性日益凸显。利用语料库技术辅助外训口译,具有较强的现实意义和发展前景。以《毛泽东军事思想》外训课程为研究对象,利用互联网获取权威双语语料,进行对齐、手动建立术语库等语料加工,建立了可供检索的毛泽东军事思想汉英双语语料库。该语料库的建立,证明了小型平行语料库辅助外军留学生课堂口译的可操作性。

闫晓霞,师莹^[4]（2017）在《我国旅游语料库翻译研究评述》文中进行了进一步梳理近年来我国大力开发旅游市场,有关旅游语料库翻译的研究丰富多样,涉及面广。其研究主要包括两个方面:一是旅游语料库翻译创建应用研究;二是旅游语料库翻译在外语教育教学中的应用研究。有关研究为构建各省市旅游语料库翻译,深化教学课程结构,完善语料库翻译研究,拓展旅游市场具有积极的作用。

王华^[5]（2016）在《语料库语言学下的语言阅读教学研究》文中认为语料库语言学拓展了语言研究的范围和广度,使语言研究的可靠性有了很大程度的提升,本文从语料库语言学的视角出发,对语言阅读教学的相关问题进行分析和探讨,旨在提高语言阅读教学水平。

吕林芳^[6]（2014）在《语料库在现代汉语近义词区分中的应用——以“充分”和“充足”为例》文中研究指明本文基于大规模的语料库,比较分析了现代汉语充分和充足这一组近义词在句法特征、语义与语用上的异同。通过这一比较分析,我们可以较为清楚的意识到语料库在现代汉语近义词区分中的重要作用。

陈晓美^[7]（2014）在《网络评论观点知识发现研究》文中进行了进一步梳理当今的中国，客观存在两个社会舆论场，一个是以报纸、广播电视等为主流媒体的社会舆论场，一个是以互联网和近几年来兴起的Web2.0应用为平台的民间舆论场。在新的Web2.0环境下，基于互联网的社会舆论平台除了原有的网站新闻评论、BBS等形式外，又涌现出了聚合新闻（RSS）、维基百科（Wiki）、QQ等即时通信工具（IM）、（微）博客、播客、淘宝与易趣综合的商务平台等新形式，使得网络当中的评论信息量得到了快速增长。目前我国网民规模已经进入发展平台期，手机成为新增网民的第一主力，微博、社区等微内容成为网络评论观点的主要来源，及时性、开放性、交互性、思想性、草根性成为网络评论信息的新特征，深深影响着人们生活的各个领域，改变了社会舆论生成演变与聚合的机制，拓展了社会舆论的传播空间。在Web2.0环境下，人们普遍感到，获得观点已经与获取信息同等重要，但要想从中获得体现价值的观点信息却变得越来越困难。究其原因在于：一是由于发表评论的人角度或目的不同，评论观点经常是正面和负面意见相混合，从中准确获取评论信息将花费很多时间和精力；二是由于以Web2.0应用为平台的民间舆论场的信息源受到较大的污染，网络评论中的这些主观信息五花八门、纷繁芜杂，良莠不齐，而以往采用的传统网络社会舆论分析技术手段（主要对象是网页和论坛）对动态性更强、结构更复杂的Web2.0网络应用处理能力有限，无法获取这些深层社会舆论信息要素，也无法甄对信息真伪，影响了网络评论信息分析效果。鉴于此，开展对于Web2.0的网络评论信息的分析研究，有助于我们更好地发掘蕴含在网络评论背后的观点信息，为决策和对未来的预测提供更加深层和丰富的信息支持，同时在理论上丰富网络评论信息分析的理论体系。本论文以Web2.0应用为平台的民间舆论场的信息源为逻辑起点，综合运用文本挖掘、观点挖掘、知识发现、LDA主题模型、本体学习等理论和方法，从主题聚类视角对网络评论信息分析模式、观点挖掘的理论、技术、方法及其应用等问题进行了较深入系统的研究。论文所做的主要研究工作如下：（1）对选题相关的国内外研究现状、热点与前沿、应用进展进行了较全面系统的分析与综述。梳理、分析了网络评论观点知识发现的相关理论与方法，为本研究工作的展开奠定了坚实的理论与方法基础。（2）以显式观点的特征－情感关联关系发现方式作为非结构化评论文本的观点挖掘基础，利用网站提供的半结构化的显式观点提取评论对象的特征、情感极性和二者搭配关系，构建观点知识库，在一定程度上解决情感词语境敏感问题，将观点知识库作为非结构化评论文本的观点挖掘基础，辅助完整的挖掘工作。（3）提出基于LDA（Latent DirichletAllocation，潜在狄利克雷分配）主题聚类的网络评论知识发现的主要任务和解决方法，包括相似评论文本聚类、评论主要观点抽取、深度观点判定等方法。（4）从认知视角，分析探讨了面向隐性认知的网络评论知识发现规律，在此基础上以领域知识为核心，将基于观点词的一般挖掘与基于主题的深度挖掘相融合，构建了多库融合的网络评论观点知识发现模式。（5）以教育领域网络评论观点挖掘为例进行了实证研究，为其应用研究提供了有价值的参考。论文取得的创新研究成果包括以下三个方面：（1）构建了基于本体的观点知识库，并提出了基于观点本体知识库的观点挖掘模式，有助于解决隐式观点识别和语境敏感问题，并可辅助提高领域词典的动态扩展性。（2）基于主题聚类视角，运用LDA主题模型，结合观点分离与观点摘要集成算法，提出了网络评论主要观点识别、深度观点发现等方法。（3）将基于观点词的一般挖掘与基于主题的深度挖掘相融合，通过领域知识进行互补，构建了观点-领域知识-主题多库融合的网络评论观点知识发现模式。

刘星慧^[8]（2013）在《基于语料库的大学英语口语中的词汇法研究》文中进行了进一步梳理口语语料库的出现为英语口语教学提供了一个崭新的平台。然而,如何在口语教学中借助口语语料库来提高口语教学效率,国内很少有人涉及。通过实证研究探讨词汇法在大学英语口语教学中的作用,具体讨论学习者的口语能力同基于口语的语料库词汇教学法有无联系。指出借助口语语料库,设计适合于探索性的教学活动是目前口语课堂教学改革的主要措施,也是培养学生口语自主学习能力的重要途径,以及其对大学英语写作教学的启示。

施扉桐^[9]（2014）在《基于语料库对转变类动词的语义韵研究》文中提出从60年代开始,语料库在行为主义的影响下不断发展。由于与乔姆斯基的理论相违背,语料语言学在其发展的初期并没有引起太大的共鸣,但是现代语料语言学已经得到越来越多人的承认,其应用也越来越广泛,从语言分析、语言教学、词典编撰到人工智能等领域都开始应用语料库等。随着语料库语言学的发展,语言学家们通过对其研究提出了—些新的概念,语义韵就是其中之一。它首先由洛夫提出,并随着语料库的壮大而不断得到深入研究。语言学家都对其提出了自己的观点,并利用语料库加以证明。本篇论文将基于语料库对转变类动词turn, run, get, go, grow, become以及transform into, convert into, change to, morph into进行语义韵的研究。研究发现：1,get, go, grow体现了消极语义韵,become则很少体现出中性语义韵,更多的是积极或消极语义韵,turn则体现出了混合语义韵。Transform into和convert into更多体现了积极和中性语义韵,较少体现消极语义韵,morph into和change to分别体现了混合语义韵和中性语义韵。2,在对每个单词短语不同形式的语义韵分析,也从中发现某个单词某些形式的语义韵与它总体的语义韵并不一致。3,一些动词也会与一些介词搭配来强调其所表达的意思。4,在研究这些单词及短语的常用搭配时,发现这些搭配的词性并不一致。比如,run会与形容词,副词,介词搭配,但其他动词大部分只与形容词搭配。Change to会与动词搭配,但这一现象不会出现在其他动词短语身上。

黄曼^[10]（2013）在《构式视角下的汉英习语变异研究》文中进行了进一步梳理习语是民族语言的精华,也是客观外界和民族文化的概念化表现,其形成经历了长期的历史积累和沉淀。各民族中都有大量的习语存在。它们形式多样、结构凝练、数目众多、表达力丰富,非其它语言表达式可替代。许多国内外学者都已将研究目光投向习语这种特殊的意义组合体,并在多种方向取得了显着的成果,比如从修辞学、文体学、语义学等方面的研究。这些研究都为我们提供了宝贵的借鉴价值。然而,随着科技的发展和社会的进步,新概念、新事物以及新的社会现象等都在不断地涌现和更替,随之而来的是不断出现的新的语言表达。互联网技术的普及和发展以及网络文化的流行,更促使着这些新的语言表达正在并且还将以我们难以想象的速度传播与发展。在这一过程中,习语作为语言表达的一个重要组成部分,也被人们赋予了许多新的用法,形成了诸多的变体。这些习语的变体如同习语本身一般形态多样,且意义丰富,具有研究价值。时至今日,已有很多学者将研究目光投向这种新奇独特的非常规语言使用,比如从语言学、认知、文学、修辞学以及社会学等视角对其进行考察等等。然而总的来说,对于汉英习语变异的研究还有许多发展和进步的空间。我们认为目前习语变异研究中发展不足之处主要有以下几点：1)在习语变异的研究中,对现象描写多阐释少；2)术语混淆不统一；3)共时研究占主导,历时研究明显不足,静态事实描写多于动态演变描述；4)对比研究明显不够,尤其是在认知理论指导下的汉英或英汉习语变异对比研究。本研究中,我们认为汉英习语变异新创意义的产出和理解并非某种单一认知机制可以解释,而是需要多种认知方式的协调与整合运作。我们以认知语言学的前沿理论—构式语法理论为指导,以新兴语言使用环境中汉英习语变异的真实语料为研究对象,结合归纳与演绎、定性与定量的研究方法,探讨这一新的语言事实背后的普遍认知运作机制和过程,对汉英习语变异现象作出较为全面的描写以及较为合理的解释。本研究的主要结论在于以下几点：第一、对汉英习语变异现象中的相关术语的定义进行了界定和统一,并对汉英习语变异现象进行了较为全面地分类、描写和归纳,并对其语言特征进行了描述和对比阐释。第二、汉英习语变异现象反映了社会的演变以及语言发展的内在规律,既具有相对稳定性又具有相对灵活性。该现象中汉英语言的相似特点反映了两种语言中发展的相似趋同性,不同特点则反映了两种语言演变过程中的相对特殊性,同时还反映了两个民族中人们认知特点、认知方式的独特性。汉英习语变异的对比研究有助于对两种语言发展的内在规律进行深入探讨。第三、基于对前人研究成果的借鉴,对汉英习语变异表达背后的生成机制和识解机制进行了探讨。本研究中首次提出汉英语习语变异现象皆是复杂的语言表达的事实。该事实需要结合多种认知机制的整合运作进行合理解释。我们在理论上的主要发现有：1)习语变异现象是人们在对习语原型构式进行去习语化和去范畴化认知操作的基础上对其进行再范畴化和再次语义整合的多次认知过程。在这一认知过程中,汉英习语变异现象存在显着的共性。习语变体构式的意义理解形成了一种认知的连续统。这一连续统并不是界限分明的,而是边界模糊的。汉英习语变异新创意义的产出和理解是语言事实背后认知主体所具备的各种认知能力多次复合加工与整合运作的结果。2)汉英习语变异现象中原型构式与变体构式之间存在各种不同的压制模式。构式的压制构成习语变异的生成机制之一。我们扩大了构式语法理论中压制的定义范围,并对构式压制词汇的原则进行了补充,增加了词汇压制、语音压制、时体压制以及多重压制等,并且通过分析具体汉语语料验证了这几种压制在汉英习语变异过程中的运作及其解释力。3)汉英习语变异的第二个生成机制是构式的识解。我们结合具体语料对五种维度的识解方式在该现象中的运作进行了较为合理的解释说明,并且指出,每一个习语变体中的变异成分都对应着具体的语境和语用信息,因此习语变异现象是一种语境依赖性和语用性都较强的语言事实。4)习语变异的第三个生成机制是构式的整合。我们在Fauconnier等学者提出的四空间概念整合模型图基础之上,增加了认知主体所采用的识解方式,提出了新的习语构式变异的压制识解整合立体模型图。新立体模型图的优点主要有两点,其一在于能够较清晰地体现构式整合过程的动态性特征,其二在于能够清楚地表现这一过程中不同认知加工方式的运作,从而能够更清楚地体现不同习语变异类型或不同语言习语变异的同质性和异质性特征。5)汉英习语变异中变体构式的五种理据,即隐喻、转喻、象似性、范畴化以及类比,构成了习语变异的识解机制。该识解机制为我们解释了习语变异现象中变体缘何而来的问题,并且为如何理解变体新意义提供了认知阐释。第四、通过对习语变异现象的探讨和研究,我们可对语言发展与变异趋势及其影响进行一定程度的判断。语言的发展和变化时刻都在发生。随着科技与网络更快更新地发展以及新兴事物和社会现象的不断涌现,习语变异现象也会随之发展和继续,其不规范的程度或许会更甚于现在。本研究在吸收和借鉴前人研究的基础上,主要有以下几点创新之处：1)首次对汉英习语变异这一语言现象进行较全面的、系统的整理、归纳和分析,并建立了汉英习语变体封闭语料库；2)首次在构式语法理论的指导下对汉英习语变异现象进行对比研究；3)首次建立针对汉英习语变异过程的多维度动态认知整合运作网络模型,并在其中创造性地增加了生成机制和识解机制的框架表征,既能表现变异过程中构式整合的动态性以及认知复杂性等特点,又能体现不同习语变异类型以及不同语言之间习语变异的共性和个性；4)首次提出汉英习语变异现象并非单一方式或机制的认知过程,而是需要借助认知主体所具有的多种认知能力复合加工运作的复杂认知过程。

二、语料语言学及其应用（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、语料语言学及其应用（论文提纲范文）

（1）语句意图匹配方法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 课题的研究背景及意义

1.2 语句意图匹配方法研究现状

1.2.1 意图匹配数据集研究现状

1.2.2 意图匹配算法研究现状

1.2.3 词义学习方法研究现状

1.3 论文的研究内容及创新点

1.3.1 研究内容概述

1.3.2 主要创新点

1.4 论文的组织结构

第2章基于无监督方法的问句意图匹配语料构建

2.1 引言

2.2 相关技术简介

2.2.1 Word2Vec词向量

2.2.2 GloVe词向量

2.3 LCQMC意图语料构建

2.3.1 意图数据收集

2.3.2 基于无监督距离算法的句对过滤方法

2.3.3 问句对人工标注

2.3.4 语料构建代价

2.4 评价与实验

2.4.1 评价指标

2.4.2 评价方法

2.4.3 实验结果

2.5 LCQMC语料质量分析

2.5.1 基于关键词的数据构建方法分析

2.5.2 语料中数据匹配类型统计

2.5.3 语料中句对词汇重叠率

2.6 本章小结

第3章基于语句差异性特征的匹配方法

3.1 引言

3.2 相关技术简介

3.2.1 循环神经网络语言模型

3.2.2 预训练BERT语言模型

3.3 语义差特征意图匹配模型

3.3.1 语句中词汇差抽取

3.3.2 基于LSTM编码的语句差异性特征表示

3.3.3 基于BERT编码的语句差异性特征表示

3.3.4 门控机制原理

3.4 评价与实验

3.4.1 数据集与评价指标

3.4.2 实验对比方法

3.4.3 实验设置

3.4.4 实验结果

3.4.5 样例分析

3.5 基于语句差异性特征的模型分析

3.5.1 语句差异性特征的时序信息分析

3.5.2 词汇差与非重叠词汇差异对比

3.5.3 门控机制可视化

3.5.4 模型通用性实验

3.5.5 重叠词汇有效性实验

3.5.6 错误样例

3.6 本章小结

第4章面向意图匹配的词向量分解词义学习方法

4.1 引言

4.2 相关技术简介

4.2.1 胶囊神经网络简介

4.2.2 注意力机制简介

4.3 基于胶囊网络的向量分解与词义学习

4.3.1 基于胶囊网络的词向量分解

4.3.2 词语上下文学习

4.3.3 词义匹配训练

4.4 评价与实验

4.4.1 数据集与评价指标

4.4.2 实验对比方法

4.4.3 实验结果

4.5 基于胶囊网络的词向量分解方法分析

4.5.1 Caps Dec E2S模型消融实验

4.5.2 上下文词义相似性可视化

4.5.3 上下文注意力权重分析

4.5.4 错误样例分析

4.6 词义向量在意图匹配任务上的应用效果

4.6.1 数据预处理

4.6.2 实验方法改进

4.6.3 实验结果

4.7 本章小结

第5章基于意图的领域内知识与文本匹配方法

5.1 引言

5.2 相关技术简介

5.2.1 知识图谱简介

5.2.2 LDA主题模型简介

5.3 基于关系与主题胶囊网络的意图匹配方法

5.3.1 基于意图关系与主题的胶囊网络结构

5.3.2 意图关系相关性计算

5.3.3 意图主题重要性计算

5.4 评价与实验

5.4.1 数据集与评价指标

5.4.2 实验对比方法

5.4.3 实验结果

5.5 实验结果分析

5.5.1 有效性测试

5.5.2 RTCaps模型消融实验

5.5.3 意图信息可视化

5.6 本章小结

结论

参考文献

攻读博士学位期间发表的论文及其他成果

致谢

个人简历

（2）基于语料库的近代汉语“甚类词”研究（论文提纲范文）

摘要

ABSTRACT

绪论

第一节国内外研究现状

一、“甚类词”的研究现状

二、语料库语言学的发展现状

第二节研究目的和研究意义

一、研究目的

二、研究意义

第三节语料来源和研究方法

一、语料来源

二、研究方法

第一章近代汉语“甚类词”的面貌特征

第一节基于语料库的数据分析

一、近代汉语“甚类词”的共时语言特征

二、近代汉语“甚类词”的历时变化特征

第二节近代汉语“甚类词”主要成员的使用情况

一、继承而来的“甚类词”

二、近代汉语新兴的“甚类词”

第二章 “甚类词”的句法搭配特征

第一节 “甚类词”的组合特征

一、修饰形容词性结构

二、修饰动词性结构

三、修饰主谓结构

四、修饰状中短语

五、修饰名词性结构

第二节 “甚类词”的句法功能

一、作状语

二、作补语

第三节 “甚类词”对修饰成分的选择

一、对搭配成分的音节选择

二、对被修饰成分的肯定与否定选择

第三章 “甚类词”构式搭配分析

第一节构式搭配强度分析

一、研究目的

二、研究方法

三、数据分析

四、构式搭配强度

第二节聚类分析

第三节多项特异共现词位分析

第四节对应分析

第四章个案研究

第一节程度副词的形成

一、程度副词形成的原因

二、程度副词形成的条件

第二节 “这+X”词的考察

第三节 “那+X”词的考察

第四节 “恁+X”词的考察

第五节 “甚类词”的类型学考察

结语

一、已做的工作和成绩

二、汉语语料库语言学的不足

附录

参考文献

攻读学位期间取得的研究成果

致谢

（3）语料库辅助下的外军留学生课堂口译研究（论文提纲范文）

一、研究目的

二、研究方法

1. 理论依据

2. 工具选择

3. 语料搜集

4. 语料制作

5. 语料对齐

三、结语

（4）我国旅游语料库翻译研究评述（论文提纲范文）

一、旅游语料库翻译创建应用研究

二、旅游语料库翻译在外语教育教学中的应用研究

（5）语料库语言学下的语言阅读教学研究（论文提纲范文）

引言

一、语料库语言学

二、语料库语言学与语言阅读教学

(一)建立语料库

(二)加强语言阅读训练

(三)合理地设计教学大纲

结语

（6）语料库在现代汉语近义词区分中的应用——以“充分”和“充足”为例（论文提纲范文）

一 . 引言

二 . 语料库及其在语言研究中的运用

1.语料库语言学的发展

2.语料库在现代汉语研究中的应用

三 . 语料库在充分与充足中的研究

1.充分与充足常见解释

2.在语料库中的体现

3.特征总结

四 . 结语

（7）网络评论观点知识发现研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景

1.1.1 网络评论进入主流社会关注视野

1.1.2 Web2. 0 环境下社会舆论传播格局

1.1.3 挖掘有价值的观点信息已成为一项重要的研究课题

1.2 研究意义

1.2.1 理论意义

1.2.2 实践意义

1.3 国内外研究现状

1.3.1 国外网络评论观点研究进展

1.3.2 国内网络评论观点研究现状

1.4 研究内容与研究方法

1.4.1 研究内容

1.4.2 研究方法

1.4.3 研究思路

1.5 论文框架与主要创新点

1.5.1 论文的主要框架

1.5.2 论文的主要创新点

1.6 本章小结

第2章相关理论与方法

2.1 评论观点与认知

2.2 文本挖掘理论与方法

2.2.1 中文分词与文本表示

2.2.2 文本分类和聚类

2.2.3 信息抽取和关联分析

2.2.4 文本挖掘过程模型

2.3 观点挖掘理论与方法

2.3.1 观点挖掘内涵

2.3.2 观点挖掘关键内容

2.3.3 观点挖掘主要应用

2.3.4 观点挖掘技术与方法

2.3.5 观点挖掘核心工具和资源

2.4 主题模型聚类方法

2.4.1 LDA 主题模型数学基础

2.4.2 LDA 模型文档生成过程

2.4.3 基于 LDA 模型的主题建模过程

2.4.4 扩展的 LDA 模型算法

2.5 知识发现理论与方法

2.5.1 知识发现的内涵

2.5.2 知识发现的方法论基础

2.5.3 图书情报领域的知识发现趋向

2.5.4 基于内在认知的知识发现

2.6 本章小结

第3章面向观点挖掘的网络评论知识发现研究

3.1 网络评论概念界定

3.1.1 网络评论的内涵

3.1.2 网络评论主要类型

3.2 观点挖掘对象

3.2.1 评价对象特征词识别

3.2.2 评价对象情感词识别及情感倾向分析

3.2.3 特征词-情感词搭配关系判定

3.3 基于观点知识库的网络评论观点挖掘模式构建

3.3.1 显式观点提取关键步骤

3.3.2 观点知识库生成方法

3.3.3 基于本体的观点知识库表示

3.3.4 基于本体的网络观点挖掘模式

3.4 本章小结

第4章面向主题的网络评论知识发现研究

4.1 个体隐性认知与群体认知

4.1.1 个体认知过程

4.1.2 面向隐性认知的网络评论知识发现

4.2 主题聚类视角下网络评论观点挖掘方法分析

4.2.1 基于主题聚类的网络评论主题语义揭示

4.2.2 基于主题聚类的评论主题与评论文本的关联与分布解析

4.2.3 基于主题聚类的重要度计算方法

4.3 基于主题相似度的网络评论聚类研究

4.3.1 主题相似度度量方法

4.3.2 基于主题的相似评论文本聚类

4.4 基于主题和情感的深度观点判定研究

4.4.1 深度观点概念及要素

4.4.2 深度观点判定算法解析

4.5 基于主题分布的主要观点提取研究

4.5.1 专家观点和大众观点剥离

4.5.2 大众代表性观点摘要生成

4.6 本章小结

第5章网络评论观点知识发现模式

5.1 基于内在认知的数据融合研究

5.1.1 基于认知特征的内在认知机理

5.1.2 基于内在认知的数据库-知识库协同机制

5.2 观点-领域知识-主题多库融合的网络评论观点知识发现模式

5.2.1 网络评论观点知识发现的基础

5.2.2 多库融合的网络评论观点知识发现模式

5.2.3 基于本体的领域知识库构建

5.2.4 基于多库的知识点映射

5.2.5 语义检索

5.3 本章小结

第6章实证分析——以教育领域图书网络评论观点挖掘为例

6.1 开发平台与工具

6.1.1 R 语言

6.1.2 R 的程序包

6.2 背景需求

6.3 模块构成

6.3.1 数据源选择与获取

6.3.2 面向语法的观点挖掘数据分析

6.3.3 面向主题的数据建模与分析

6.3.4 领域知识库融合

6.4 结果评价

第7章结论与展望

7.1 研究结论

7.2 论文创新点

7.3 论文展望

参考文献

攻读博士学位期间取得的主要科研成果

后记和致谢

（8）基于语料库的大学英语口语中的词汇法研究（论文提纲范文）

1 研究的背景

2 大学英语口语教学的设计

2.1 词汇法在口语教学中具体方法

2.2 语料库内容概述

2.3 语料库在口语教学中的重要性

3 基于语料库的口语词汇法的试验研究

3.1 研究对象介绍

3.2 假设检验

3.3 试验步骤

3.4 测试与分析

4 结论和建议

（9）基于语料库对转变类动词的语义韵研究（论文提纲范文）

摘要

Abstract

CONTENTS

Chapter One Introduction

1.1 Research Background

1.2 Research Significance

1.3 General Layout

Chapter Two Literature Review

2.1 Previous Studies on Collocation

2.1.1 Concepts of Collocation

2.1.2 Classification of Collocation

2.1.2.1 Classification of Collocation in China

2.1.2.2 Classification of Collocation Overseas

2.2 Previous Studies on Semantic Prosody

2.2.1 Concepts of Semantic Prosody

2.2.2 Alternative Concepts of Semantic Prosody

2.2.3 Categories of Semantic Prosody

2.2.4 Feature of Semantic Prosody

2.2.4.1 Evaluation

2.2.4.2 Trans-boundary

2.2.4.3 Hiddenness

2.2.4.4 Grammar-Related

2.2.5 Empirical Researches on Semantic Prosody

2.2.5.1 Mono-linguistic Studies on Semantic Prosody

2.2.5.2 Cross-linguistics Studies on Semantic Prosody

2.2.6 Semantic Prosody Studies in China

2.2.6.1 Theoretical Studies

2.2.6.2 Empirical Studies

2.2.6.3 Registers Studies

2.2.6.4 Practical Studies

2.3 Introduction of Corpus Studies

2.3.1 Corpus Linguistics

2.3.2 Basic Definition of Corpora

2.3.3 Corpus-based Approach

Chapter Three Methodology

3.1 Introduction to Corpus Used in this Research

3.2 The Studied Objects

3.2.1 A list of 'Turn' Verbs in Thesaurus

3.2.2 The Taxonomy of the Studied Objects

Chapter Four Data Processing and Analysis

4.1 'Become'

4.2 'Turn'

4.3 'Get'

4.4 'Go'

4.5 'Run'

4.6 'Grow'

4.7 'Transform into'

4.8 'Change to'

4.9 'Morph into'

4.10 'Convert into'

4.11 Conclusion

Chapter Five Conclusion

5.1 Analysis Conclusion

5.2 Implication

5.3 Limitation

Bibliography

Acknowledgements

（10）构式视角下的汉英习语变异研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 引言

1.2 研究意义

1.3 研究方法

1.3.1 研究目标

1.3.2 研究内容

1.3.3 语料描述

1.3.4 分析方法

1.4 论文框架

第二章文献综述

2.1 引言

2.2 定义

2.2.1 习语

2.2.2 习语变异

2.3 汉英习语研究概述

2.3.1 国外学者习语研究

2.3.2 国内学者习语研究

2.4 汉英习语变异研究概述

2.4.1 国内外学者语言变异研究

2.4.2 国内外学者习语变异研究

2.5 构式语法研究概述

2.5.1 国外学者构式语法研究

2.5.2 国内学者构式语法研究

2.6 小结

第三章汉英习语变异研究理论框架

3.1 引言

3.2 构式语法定义

3.2.1 构式

3.2.2 构式语法

3.3 主要构式理论在本研究中的应用

3.3.1 构式的压制

3.3.2 构式的整合

3.3.3 构式的识解

3.3.4 构式的理据

3.4 小结

第四章汉英习语变异语料的语言学特征

4.1 引言

4.2 汉英习语变异分类

4.2.1 汉语习语变异分类

4.2.2 汉语文学作品中习语变异使用频率的数据统计

4.2.3 英语习语变异分类

4.3 汉英习语变异的语言特征

4.3.1 汉英习语变异的语音特征及对比

4.3.2 汉英习语变异的语义特征及对比

4.3.3 汉英习语变异的语用特征及对比

4.3.4 汉英习语变异的句法特征及对比

4.4 小结

第五章汉英习语变异与构式的压制—变异生成机制之一

5.1 引言

5.2 汉英习语变异中的压制

5.2.1 构式压制

5.2.2 词汇压制

5.2.3 语音压制

5.2.4 时体压制

5.2.5 多重压制

5.3 对比分析

5.4 小结

第六章汉英习语变异与构式的识解—变异生成机制之二

6.1 引言

6.2 汉英习语变异中构式的识解方式

6.2.1 汉英习语变异与详略度

6.2.2 汉英习语变异与辖域

6.2.3 汉英习语变异与背景

6.2.4 汉英习语变异与视角

6.2.5 汉英习语变异与突显

6.3 对比分析

6.4 小结

第七章汉英习语变异与构式的整合—变异生成机制之三

7.1 引言

7.2 汉英习语变异中构式的概念空间

7.3 汉英习语变异中的构式整合

7.4 汉英习语变异整合运作模型图

7.5 对比分析

7.6 小结

第八章汉英习语变异与构式理据—习语变异的识解机制

8.1 引言

8.2 汉英习语变异与隐喻

8.2.1 语义隐喻

8.2.2 语音隐喻

8.3 汉英习语变异与转喻

8.4 汉英习语变异与象似性

8.4.1 语音象似

8.4.2 顺序象似

8.5 汉英习语变异与范畴化

8.6 汉英习语变异与类比

8.6.1 谐音类比

8.6.2 形式类比

8.6.3 语义类比

8.7 对比分析

第九章结论

9.1 引言

9.2 本研究的主要结论

9.3 本研究的主要创新

9.4 本研究的理论启示及应用价值

9.4.1 对习语教学的启示

9.4.2 对词典编纂的启示

9.4.3 对语料库应用的启示

9.4.4 对习语及习语变体翻译的启示

9.5 本研究的局限及后续研究方向

参考文献

致谢

四、语料语言学及其应用（论文参考文献）

[1]语句意图匹配方法研究[D]. 刘欣. 哈尔滨工业大学, 2021(02)
[2]基于语料库的近代汉语“甚类词”研究[D]. 林丽. 浙江师范大学, 2020(02)
[3]语料库辅助下的外军留学生课堂口译研究[J]. 杜燕航,田文杰,屈轶. 现代交际, 2020(07)
[4]我国旅游语料库翻译研究评述[J]. 闫晓霞,师莹. 太原师范学院学报(社会科学版), 2017(03)
[5]语料库语言学下的语言阅读教学研究[J]. 王华. 语文建设, 2016(11)
[6]语料库在现代汉语近义词区分中的应用——以“充分”和“充足”为例[J]. 吕林芳. 青年作家, 2014(12)
[7]网络评论观点知识发现研究[D]. 陈晓美. 吉林大学, 2014(09)
[8]基于语料库的大学英语口语中的词汇法研究[J]. 刘星慧. 忻州师范学院学报, 2013(06)
[9]基于语料库对转变类动词的语义韵研究[D]. 施扉桐. 华东理工大学, 2014(06)
[10]构式视角下的汉英习语变异研究[D]. 黄曼. 华中师范大学, 2013(11)

标签：自然语言处理论文; 语料库论文; 语言学论文; 主题模型论文; 语义分析论文;

语料库语言学及其应用

一、语料语言学及其应用（论文文献综述）

二、语料语言学及其应用（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、语料语言学及其应用（论文提纲范文）

（1）语句意图匹配方法研究（论文提纲范文）

（2）基于语料库的近代汉语“甚类词”研究（论文提纲范文）

（3）语料库辅助下的外军留学生课堂口译研究（论文提纲范文）

（4）我国旅游语料库翻译研究评述（论文提纲范文）

（5）语料库语言学下的语言阅读教学研究（论文提纲范文）

（6）语料库在现代汉语近义词区分中的应用——以“充分”和“充足”为例（论文提纲范文）

（7）网络评论观点知识发现研究（论文提纲范文）

（8）基于语料库的大学英语口语中的词汇法研究（论文提纲范文）

（9）基于语料库对转变类动词的语义韵研究（论文提纲范文）

（10）构式视角下的汉英习语变异研究（论文提纲范文）

四、语料语言学及其应用（论文参考文献）

猜你喜欢