一、四种拼音输入法的特点介绍(论文文献综述)
潘利健[1](2021)在《中文文本校对语料库自动生成技术研究》文中认为中文文本的自动校对技术是自然语言处理的重要应用技术之一。当前使用深度学习的方法进行中文文本校对或者使用深度学习和传统方法结合已经成为主流。然而使用深度学习方法最重要的挑战之一是没有足够多的标记数据用于模型的训练。为解决校对数据不足的问题,本文提出自动生成中文文本校对语料库的方法。鉴于当前中文校对数据分为两类,即中文文本拼写校对和中文文本语法校对,因此本文的主要工作有两点:一是自动生成中文拼写校对语料库;二是自动生成中文语法校对语料库。在生成中文拼写校对语料库时,由于不同输入法会产生不同形式的拼写错误,因此本文分别为校对拼音输入法、光学字符识别输入法(OCR)以及语音识别输入法(ASR)这三类主流输入法生成的文本构建了对应的语料库,将其分别简称为拼音语料库、OCR语料库以及ASR语料库,本文使用拼音与汉字的相互转换技术来生成拼写语料库,基于光学字符识别技术生成OCR语料库,基于ASR技术生成ASR语料库。在生成语法校对语料库时,主要使用了两类方法,一类是构建拼写校对语料库的相关方法,包括汉字转拼音技术、拼音转汉字技术和OCR技术,这类方法主要用来生成别字错误;另一类是基于翻译的方法,即将正确的句子翻译成错误的句子,该方法主要用来生成多字符、少字符以及字符顺序颠倒类的错误。我们使用基于错误检测的方法、基于统计的方法以及人工评测的方法来评估语料库的质量。实验证明,本文生成的语料数据可以较好的模拟真实的错误句子,对中文文本校对任务有较大帮助,其中在拼写校对数据sighan2015上,使用本文构建的语料库比不使用F1值最多提升约4.8个百分点;在公布的语法校对数据NLPTEA2018上,使用本文构建的语料库F1值最多提升约5.7个百分点。
李阁[2](2021)在《面向马来西亚零基础汉语学习者的线上识字教学策略初探》文中提出新冠疫情期间,国际汉语教育进入了线上教学的新时代,本文即是在这个大背景下进行实践和研究的。笔者以马来西亚马六甲伊斯兰大学为实践教学点,在对零基础的大学一年级的学生进行线上汉语教学的过程中,以行动研究为主要研究方法进行汉字认读教学的尝试,通过两个阶段的教学实践,对教学设计、教学策略进行分析研究,通过测试评估教学效果,论证其在马来西亚大学零基础汉语课堂中的可行性以及教师在运用该教学方法进行汉语教学时应该注意的事项以及改进的措施。为线上零基础的汉字教学提供一种新的教学思路。本文主要从以下几个角度探讨线上识字教学策略:第一章是“绪论”,主要阐述了认读汉字的研究目的和意义,国内外的研究状况,研究方法以及实践学校的汉语教学概况,包括马六甲伊斯兰大学汉语课程设置,教学对象,以及笔者的教学实践经历。第二章是“线上识字教学策略总体设计”,这一章中介绍了线上识字教学策略的教学理念、教学特点、教学目标以及教学过程。第三章是“第一教学阶段线上识字教学策略教学实践过程及问题分析”,主要介绍了线上识字教学策略在课堂教学中的具体运用,从教学过程、教学设计、教学方法等方面进行实证分析,检验学生认读汉字的结果,分析教学实践中出现的问题。第四章是“第二教学阶段线上识字教学策略改良探索”,本章节阐述的主要是在第一教学阶段教学的基础上,从课件制作、课堂组织、教学内容、作业布置、课堂检测等方面对线上识字教学策略进行了调整和改进。第五章是“第一教学阶段和第二教学阶段教学效果对比分析”,本章节包括三个部分,第一部分是“第一教学阶段键盘输入汉字测试结果分析”,这一部分是对第一教学阶段键盘输入汉字练习的总结和反思;本章节的第二部分是“第二教学阶段键盘输入汉字测试结果分析”,这一部分是第二教学阶段在吸取第一教学阶段教学经验的基础上对键盘输入汉字练习进行了改良和调整。本章节包括的第三个部分是“汉字认读课堂测试结果分析”,这一部分是对第一教学阶段和第二教学阶段的课堂测试结果的统计与对比分析,通过数据统计与对比,归纳了线上识字教学策略的实践价值和意义,为汉字教学提供教学参考。第六章是“关于线上识字教学策略的思考”,本章节包括两个部分,第一部分是关于教学理念的思考,第二部分是关于教学方法和教学策略的思考,对线上识字教学策略进行总结和反思。第七章是“结语”,本章节主要是对本论文的总结。
许璁[3](2021)在《中文词语的语义表征与学习研究》文中进行了进一步梳理作为众多自然语言处理任务的基础,词语的语义表征和学习成为了近年来的研究热点。最初的大量研究成果都是针对英语,德语等符号形语言,而中文作为象形文字具有其独特的特点。于是一些中文研究者利用中文词语中字,偏旁部首,部件构造等细粒度特征对中文语义表征算法进行了优化,使得词语的语义表征在中文自然语言处理任务中效果更好。然而,这些现有中文语义表征的算法仅仅关注于词语内部原始的特征,没有深度挖掘出词语-词语之间的语义联系以及词语内部更具针对性的细粒度特征,并且中文语料库中存在大量的错别字,但现有算法都没有考虑词语中错别字的情况,这些都极大的限制了词语的表征能力,最终影响了下游任务算法的效果。本文的主要内容以及创新点可以分为以下三个方面:第一,针对现有算法学习词语的语义表征过程中只关注在词语固定窗口里局部上下文信息,而忽略了窗口外全局上下文信息的问题。本文首次提出了语义邻居图以及软采样的概念,并基于此提出了全局邻居语义表征算法(GSN)。该算法利用全局共现信息以及相同的字符信息来构造全局的语义邻居图,对于构造好的图使用软采样来学习图中词语-词语对之间的语义关系,最终有效的提升了中文词语的语义表征能力。第二,针对现有原始细粒度特征无法有效捕捉词语语义表征的问题,本文提出了一种利用字的构造部件的n-gram信息的算法,以更好地表征词语中的字符信息。该算法通过提取字符的构造部件的n-gram信息作为字符的特征序列,同时学习词语的原始特征和新的特征序列能更有效的捕获词语的语义信息,有效的提升了词语和字符的表征能力。第三,针对当前中文语料库中存在大量错别字,而这些错别字影响最终词语表征能力的问题,本文提出了一种利用字符构造部件以及拼音字母的算法,该算法通过同时构建字符构造部件和拼音字母的n-gram信息作为字符的特征序列,在学习词语的语义表征的过程中同时学习构造部件的特征序列以及拼音字母的特征序列,尽可能的减少了错别字对词语语义表征能力的影响,使得词向量的有效性和鲁棒性都得到了极大的提升。
崔明远[4](2021)在《多点触控设备上适用于盲人和盲操作的中文输入技术研究》文中进行了进一步梳理随着智能手机、平板电脑以及其它触屏设备的广泛使用,在多点触控设备上进行文本输入变得很常见。在触控屏上现有的输入方式是通过虚拟键盘进行的。在物理键盘上通过触摸F键和J键的凸起,普通人可以进行高效的盲打输入,盲人也可以有效地使用键盘输入。但通过触摸屏上的软键盘盲打输入却无法实现盲打输入,相对于在物理键盘上普通人的输入效率就会大大降低,对盲人来说输入操作就会变得更加困难。本文在先前关于多点触控设备上适用于盲人和普通人盲打的文本(英文)输入方法的基础上,进一步研究了在触控屏上中文盲打输入过程中适用于盲人的多种相关技术:语音提示和反馈技术、翻页操作以及数字选择操作等。为此本文共进行了三部分研究。在第一部分研究中,本文对普通用户和盲人用户使用中文拼音输入法输入中文的流程进行了对比分析,重点研究了语音提示方式中,单字扩展词以及语音提示结构对输入绩效的影响,并为所有实验设计了软件框架。在第二部分研究中,本文提出了5种翻页操作操作,分别是单指长按(Single Finger Long Press,SFLP)、双指纵向轻弹(Two Fingers Vertically Flick,TFVF)、双指横向轻弹(Two Fingers Horizontally Flick,TFHF)、手指抻捏(Fingers Stretch Or Pinch,FSOP)以及单指横向轻弹(Single Finger Horizontally Flick,SFHF);和3种数字选择操作操作,分别是第N指长按(Nth Finger Long Press,NTHFLP)、N根手指长按(N Fingers Long Press,NFLP)以及第N指横向轻弹(Nth Finger Horizontally Flick,NTHFHF)。实验结果表明不同的翻页操作和不同的数字选择操作对中文输入的速度和错误率的影响都不显着,但在翻页操作中,TFHF的交互绩效综合最佳;在数字选择操作中,NTHFLP的交互绩效综合最好。在第三部分研究中,本文整合了以上研究成果,形成了一套完整的支持在多点触控设备上适用于盲人和盲操作的中文输入技术。通过和基于Android平台上无障碍辅助功能——Talk Back——的输入方式进行对比实验,发现本文提出的输入技术的交互绩效显着更优。本文的工作对盲人和普通人在多点触控屏上高效中文盲打输入模式和输入技术的设计有重要参考价值。
窦金花[5](2020)在《面向包容性的人机交互界面评估与优化方法研究》文中研究指明近年来,随着信息技术的迅猛发展和计算机设备的普及,人的工作和生活都已经与计算机软件密切相关。人机交互界面作为人使用计算机软件和产品服务的接口,其设计的优劣会直接影响人的工作效率和生活便利程度。尤其以老年用户为代表的低能力用户群体,对人机交互界面的接受程度和理解能力更低,受交互界面设计的影响程度更大。随着越来越多能力下降的用户接触和使用数字产品,迫切需要提高人机交互界面的包容性,扩大人机交互界面的可达用户群体范围,使人机交互界面对于低能力用户群体也具有良好的可用性。设计高包容性的人机交互界面目前面临需求大和设计难、效率低的困境。设计优良的人机交互界面往往需要依赖开发者的经验和创造力,并进行大量对比测试、迭代优化,然而,计算机设备和软件种类繁多、数量庞大,很多开发者往往缺乏人机交互界面设计的经验和能力,对于低能力用户群体,开发者就更加缺乏额外的精力和相应的能力专门为他们设计具有高包容性的人机交互界面。国内外研究学者对人机交互界面的包容性设计开展研究,其研究角度主要包括人机交互界面的包容性设计方法和设计流程,面向特定用户群体的包容性人机交互界面设计开发,以及与包容性设计目标相关的导向原则等。已有研究中缺少对人机交互界面包容性的评估指标、评估方法和优化方法的系统化研究。为了辅助开发者进行包容性人机交互界面设计方案决策和优化,提升设计方案决策和优化效率,亟需建立系统化的人机交互界面包容性评估指标、评估方法以及可供开发者应用的优化设计方法。针对上述亟待解决的问题,本文提出人机交互界面包容性的评估指标和计算方法,提出人机交互界面包容性影响因素提取方法,分析影响包容性的人机交互界面设计模式,提出基于知识图谱的高包容性人机交互界面优化设计方法。将所提出的理论和方法进行多场景的应用,最终形成一套完整的面向包容性的人机交互界面评估和优化设计方法。研究论文的主要内容和创新点包括以下几个部分:(1)针对人机交互界面的包容性缺少系统性的、量化的分析评估方法问题,提出了基于可用性-用户能力函数的人机交互界面包容性评估方法。具体地,首先提出了两个评估人机交互界面包容性的指标—“用户能力包容度”和“可用性的包容均值”,进一步提出可用性-用户能力函数线性模型,并呈现了基于“可用性-用户能力图”的人机交互界面包容性解释分析方法,最后,提出了量化的包容性计算模型,该模型基于可用性-用户能力函数线性模型计算评估人机交互界面的包容性,通过实验验证了上述量化评估方法的有效性。所提出的评估指标、计算模型、解释分析方法、计算评估方法形成了系统化的人机交互界面包容性评估方法,能够有效辅助设计开发者对比和评估人机交互界面的包容性。(2)针对缺少有效的方法将人机交互界面设计特征与包容性原则映射匹配、需要具体的设计模式提高人机交互界面包容性的问题,本研究提出了基于认知负荷细粒度测量分析提取人机交互界面包容性影响因素的方法。具体地,分析了人机交互过程中认知负荷来源、认知负荷与包容性的相关关系,面向知识服务网站、功能指示面板和智能产品几种常用应用领域的人机交互界面开展研究,分别选取中国非物质文化遗产网站交互界面、数控机床控制面板交互界面,智能电视交互界面进行实验研究,基地认知负荷细粒度测量分析挖掘影响包容性的人机交互界面设计特征,并总结出共性的、提高包容性的人机交互界面设计模式,以有效指导技术开发者与设计人员优化人机交互界面,提高人机交互界面的包容性。(3)针对缺少有效的优化设计方法帮助开发者简化高包容性人机交互界面设计过程、实现人机交互界面包容性大幅提升的问题,提出了基于知识图谱的高包容性人机交互界面优化设计方法。针对基于大段文本和表格的知识服务类网站人机交互界面,研究基于领域本体和自然语言处理的知识抽取方法,呈现了基于知识图谱的可视化方法,并以具体的知识服务类网站应用场景进行实验验证,展现了基于知识图谱的高包容性人机交互界面优化设计方法的应用。基于知识图谱的高包容性人机交互界面优化设计方法为知识服务类网站交互界面的设计开发提供一种有效的优化方法参考,从而减轻交互界面开发者的负担。
桓维阳[6](2020)在《面向触控移动设备的文本交互研究》文中研究指明在基于触控交互的智能移动设备中,文本交互是使用频率很高的功能。目前的主流文本交互流程分为三个步骤:文本输入、文本选择以及文本操作。本文通过对他人研究成果进行分析之后,发现文本交互的三个步骤都有着各自的局限性,局限性包括但不限于:输入时间较长、选择精度较低、选择与操作方式繁琐等。这些局限性十分影响用户的交互效率和使用体验。本文的研究目的就是在文本输入、文本选择和文本操作三个方面提出新的交互方案,以此来提升文本交互的效率和用户体验。本文的研究工作主要分为以下三个方面:第一,本文提出了一种基于拼音与笔画相结合的中文文本输入方式。通过将汉字的两种属性相结合,缓解了目前主流汉字拼音输入法备选项过多和手写输入速度过慢的问题。同时减少了点击的次数,以缓解了虚拟键盘容易误触的问题。第二,本文提出了支持选择多段不相邻文本的文本选择方式。该文本选择技术可以解决目前主流的触控移动设备系统默认的文本选择方式选择速度慢、无法选择多段不相邻文本等问题。本文提出的方案通过利用点击操作取代传统的拖拽操作的方案提升了文本选择的效率。本文设计了一种新的组件用以替代传统文本选择中的句柄,通过该组件可以实现选择模式的切换,以此完成多段不相邻文本的选择。第三,本文提出了在文本操作中以径向菜单取代目前主流的线性菜单的方案。通过将径向菜单与本文设计的文本选择的技术相结合,设计了一种基于径向菜单的进行操作的文本操作方式,缓解了用户进行文本操作时手指需要移动较长距离导致操作效率变低的问题。此外径向菜单由于呈环形且支持多级菜单,可以有效地节约触控移动设备的物理空间。在对这三种技术进行介绍之后,本文分别设计了实验对比了本文设计的技术与目前主流技术对比的优劣,并进行了数据分析,以此验证本文提出方法的可行性。本文针对触控移动设备上文本交互的三个步骤分别提出了新的交互方案,经过实验的论证,每一种交互方案对比目前主流的交互方式都有着效率上的提升。通过将三种新的交互方案结合,能够使文本交互的总体效率得到较大提升,并为移动设备的文本交互研究提供新的思路。
蔡欢[7](2020)在《信息技术在听障学生书面语沟通能力提升中作用的个案研究》文中提出听障学生书面语沟通能力的高低影响着他们与健听人的交流,因此在大力倡导融合教育的当今社会,提升听障学生的书面语沟通能力至关重要,而信息技术的发展对其书面语沟通能力的提升有着积极的影响。笔者采用个案研究法,使用方便抽样,选取了两名有听觉障碍的初中学生作为本次个案研究的对象,通过与他们进行纸笔沟通和借助信息技术手段干预的手机微信沟通两种方式,对比干预前和干预后的书面语沟通语病百分比,以及对沟通结果的书面材料进行深入分析,来探讨信息技术在听障学生书面语沟通能力提升中的作用,以及探讨相比较于纸笔沟通,借助信息技术手段来进行书面语沟通有何优势,并针对研究结果给出一些能够提升听障学生书面语沟通能力的建议。研究结果发现,总的来说利用信息技术手段的手机微信沟通能够提升听障学生书面语沟通能力。具体得出以下几点结论:(1)影响书面语沟通质量的因素:“了”字的错误使用导致时态混乱;(2)影响手机微信沟通速度的因素:拼音的使用对于听障学生来说是个不小的挑战;(3)借助信息技术手段来进行书面语沟通的优势:①图片能代替文字进行情感的准确传达。②手机、电脑上打字比纸笔书写速度快。③电子输入法打字能避免错别字的出现。根据研究结果给出下面几点建议:(1)鼓励听障学生通过手机、电脑等电子产品与他人进行书面语沟通;(2)规范听障学生手语和书面语言的表达;(3)支持听障学生利用手写输入法或者五笔输入法打字;(4)重视对听障学生信息技术课程的教学,提升其运用现代信息技术的能力;(5)教学《沟通与交往》课程时多利用现代多媒体技术促进听障学生书面语表达与理解的能力。
王冰[8](2020)在《基于深度学习的文本校对方法研究》文中认为随着互联网的飞速发展,网络上的文本数据量激增,同时也导致了文本质量下降,传统的人工校对早已无法完成如此巨量的工作,文本自动校对技术应运而生。该技术不仅能加快出版节奏,而且可以利用该技术在企业单位减少大量需要保存的电子文档中的错误,同时在在教育教学方面也能辅助教师评阅试卷,发现其中的拼写错误。传统基于统计和规则的文本校对方法存在诸多问题。一方面规则的制定需要丰富的经验,人力成本高,且这种基于流水线的模式,会由于分词产生的噪音,很容易导致错误累积。另一方面,现有方法仅使用了字或词的特征信息,对于字、词、拼音三种特征信息未进行有效的利用。针对以上问题,本文提出一种基于深度学习的序列标注模型BLSTM-CRF,无需进行人工干预,节省了人力成本,并采用字粒度的特征免去了分词引入的噪音。此外,针对多特征未有效利用问题,对BLSTM-CRF模型进行了改进,采用了网格LSTM和门控机制有效地对字、词、拼音三者进行了多特征融合。本文研究的主要内容主要分为两个方面:(1)本文提出了一种用于中文拼写检查的神经网络架构BLSTM-CRF,即双向长短时记忆网络结合条件随机场模型。它是真正的端到端模型,不依赖于特定于任务的资源,特征工程或数据预处理;其次,通过采用字粒度的向量输入,免去了分词噪音的引入。在新闻和小说两个数据集上的实验表明,模型性能F1值相较于基线模型在新闻和小说的测试集上都有较大提升。(2)本文提出了一种新颖的拼写错误检查模型FL-LSTM-CRF,该模型融合了字、词、拼音三者的特征,充分利用潜在的信息。在SIGHAN数据集上的实验结果证明了端到端框架在拼写错误检查的可行性,同时验证了字、词、拼音三者融合的特征信息在检错任务上的有效性。在使用相同的外部资源的情况下,FL-LSTM-CRF模型明显优于其他模型。
潘嘉[9](2020)在《深度学习语音识别系统中的自适应方法研究》文中认为语音是最快速、便捷的人机交互方式,语音识别技术是人工智能的重要组成部分。随着深度学习技术的进步,语音识别在多数场景中取得了接近人类的识别准确率,但是在说话人带有方言和口音、复杂环境噪声和专业领域等特殊场景下,语音识别的准确率会显着下降,影响用户的使用体验。语音识别自适应技术是提升特殊场景下语音识别准确率的有效手段之一,因此一直是语音识别领域的研究热点。相比传统语音识别系统中的自适应技术,深度学习语音识别系统中的自适应存在着模型参数庞大,而数据量相对较少等特点,这使得深度学习语音识别系统中的自适应成为一个研究难题。本文针对这些难题,在声学模型在线自适应、低资源下声学模型离线自适应、无监督声学模型离线自适应和语言模型自适应方面开展了研究工作,并将研究成果应用于实际语音识别系统中。本文的研究工作依托科大讯飞股份有限公司所承担的科技部国家重点研发计划重点专项课题《未知场景下的语音识别与意图理解》(课题编号:2018AAA0102204)进行。本文的具体研究内容包括:研究了声学模型在线自适应技术。针对声学模型在线自适应对于实时性要求极高,并且因缺乏自适应训练数据而导致自适应效果有限等问题,本文提出了基于注意力机制的声学模型在线自适应方法。利用预先训练好的说话人识别模型抽取海量说话人的特征表达并进行聚类,得到一组说话人特征基向量作为外部记忆单元;利用注意力机制实时快速的从记忆单元中挑选与当前语音段最相近的说话人基向量,并加权得到当前语音帧所对应的说话人特征表达,用于声学模型在线自适应。在此框架的基础之上,我们引入了固定大小顺序遗忘编码机制,同时提出了多级门控连接机制、说话人分类目标辅助训练和残差向量说话人特征表达,进一步的提升了声学模型在线自适应的效果。我们分别在中文和英文语音识别两个代表性数据集上进行了实验,实验结果证明了该方法能够在基本不增加语音识别计算复杂度的情况下,大幅提升声学模型在线自适应的效果。研究了低资源下声学模型离线自适应技术。针对低资源下声学模型离线自适应容易过拟合而导致泛化能力差的问题,本文提出了基于多任务学习的说话人编码方法,以及基于奇异值分解和矢量量化的自适应方法。首先,针对传统基于说话人编码的自适应方法进行了分析并指出了其中的不足;其次,针对性的引入了额外的说话人分类目标对说话人编码向量进行多任务学习,以提升该方法对于新说话人的泛化能力;然后,将说话人编码向量扩展成说话人编码矩阵以增强自适应的作用,并使用基于奇异值分解的自适应参数初始化。同时,为了能够充分压缩自适应的参数量,引入了矢量量化技术,并同步进行矢量量化训练与自适应,以减少矢量量化所带来的效果损失。在真实的语音识别数据集上,这两种方法在低资源情况下均取得了更好的自适应效果。研究了无监督声学模型离线自适应技术。针对无监督声学模型离线自适应相比有监督自适应效果损失严重的问题,本文首先提出了利用人机交互过程中的用户确认文本来帮助提高自适应数据机器标注准确率的方法;然后提出了一种基于确认模型的声学置信度方法,通过设计多种统计特征用于置信度模型的训练,直接判断当前词是否识别正确,从而显着增强了置信度与语音识别准确率之间的相关度,使得通过该置信度方法可以更好的进行自适应数据的挑选,提升机器自动标注的准确率;最后,本文跳出了传统无监督自适应方法的束缚,提出了一种基于元学习的无监督自适应方法,直接以无监督自适应后的模型在测试集上的效果为训练目标,来对通用模型进行调整,使得经过元学习后的通用模型按照预设的自适应方法能够在测试集上获取最优的效果。实验结果表明,本文提出的方法均能大幅提升无监督声学模型自适应的效果。研究了语言模型自适应技术。针对语言模型自适应数据稀疏、缺乏有效的自适应方法的问题,本文提出了基于用户修改词的N-gram语言模型自适应方法,通过从用户修改行为中挖掘用户关键词并在解码过程中进行动态激励,实现了N-gram语言模型高效快速的自适应。在保证低误触发率的前提下,该方法大幅提升了用户关键词的识别准确率。针对领域信息未知情况下的神经网络语言模型的自适应难题,本文提出了基于无监督聚类的神经网络语言模型自适应方法,通过无监督聚类对训练文本数据进行划分并训练类别专属语言模型,并利用隐层共享机制缓解类别专属语言模型训练数据稀疏的问题。在解码过程中,通过动态挑选多个类别专属语言模型的输出概率进行加权,达到提高语言模型输出概率可信度的目的。在真实的语音识别数据集上验证了本文提出的方法的有效性。在上述研究工作的基础上,介绍了自适应技术在真实深度学习语音识别系统中的应用情况。针对语音输入法场景,本文设计了语音识别云服务中声学模型自适应的服务架构,包括声学模型的自适应训练模块和自适应后声学模型的解码模块。同时,设计了“即修即改”的语言模型快速自适应功能,使得系统在语音识别错误被用户修正后可以迅速学习改进。
纪兴光[10](2019)在《基于神经网络的带有拼写纠错功能的音字转换模型》文中研究说明随着移动端设备的高速普及,人们越来越离不开智能设备完成沟通和交流。拼音输入法作为人们日常生活中的重要工具,然而在输入法的使用过程中会不可避免的产生错误输入,针对拼音的拼写纠错极大的影响了输入法用户的使用体验。本文首先对该项目所用到的关键技术进行了分析研究。针对输入法中拼音拼写纠错问题的结构特点,基于Seq2seq模型提出了结合外部信息的神经网络拼音拼写纠错模型。根据键盘上按键转移概率和输入法输入输出之间的对齐关系,改进了纠错模型的损失函数,实现对模型中Attention机制的有监督训练,提升了模型的纠错能力。此外,针对输入法中丰富的先验知识,提出了将先验知识与神经网络相结合的方式对纠错模型进行优化。通过Autoencoder方法获得用户点击位置的向量表达,改进神经网络的输入层,使纠错模型可以有效利用点击位置信息,提升对用户误触导致的错误输入的纠错能力。此外,纠错模型的Decoder部分采用了 Beam Search算法,输出是若干个拼音候选组成的集合。针对集合中的拼音候选存在排序不合理的现象,提出了基于拼音的语言统计特性的重排序模型,使用改进的pairwise算法对拼音候选进行打分,将高质量拼音候选排到候选集合前列,进一步提高了纠错结果的准确性。最后,结合上述模型和算法实现了具有纠错功能的拼音输入法系统,该系统包括用户输入的纠错模型和基于隐马尔可夫模型的汉字向拼音转换模型。最终对整个系统进行了搭建和验证。结果表明,本文提出的基于神经网络的具有纠错功能的拼音输入法模型功能完备且具有强大的纠错能力。本项目中对模型进行的优化和改进能够有效提升输入法用户使用体验,具备实际应用价值。
二、四种拼音输入法的特点介绍(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、四种拼音输入法的特点介绍(论文提纲范文)
(1)中文文本校对语料库自动生成技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题背景与意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 文章结构 |
1.5 本章小结 |
第二章 相关技术 |
2.1 中文文本校对相关技术 |
2.2 生成语料库相关技术 |
2.3 评估语料库相关技术 |
第三章 中文拼写校对语料库的自动生成及评估 |
3.1 自动生成中文拼写校对语料库 |
3.1.1 自动生成拼音语料库 |
3.1.2 自动生成ASR语料库 |
3.1.3 自动生成OCR语料库 |
3.2 评估中文拼写校对语料库 |
3.2.1 评估拼音语料库 |
3.2.2 评估ASR语料库 |
3.2.3 评估OCR语料库 |
3.3 探究本文构建的语料库在公开的比赛任务上是否有效 |
3.4 本章小结 |
第四章 中文语法校对语料库的自动生成及评估 |
4.1 自动生成中文语法校对语料库 |
4.1.1 sequence to sequence模型 |
4.1.2 语法校对任务相关数据 |
4.1.3 生成中文语法校对语料库的基本过程 |
4.1.4 训练数据预处理 |
4.1.5 筛选生成的错误句子 |
4.2 评估中文语法校对语料库 |
4.2.1 基于统计的方法评估中文语法校对语料库 |
4.2.2 基于语法错误发现方法评估中文语法校对语料库 |
4.3 本章小结 |
第五章 中文文本校对语料库自动生成及测试系统 |
5.1 系统初始输入页面 |
5.2 生成语料库实例 |
5.3 纠错测试实例 |
第六章 总结和展望 |
6.1 工作总结 |
6.2 未来展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(2)面向马来西亚零基础汉语学习者的线上识字教学策略初探(论文提纲范文)
中文摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的 |
1.3 研究综述 |
1.4 研究方法 |
1.5 马六甲伊斯兰大学汉语教学概况 |
第2章 线上识字教学策略总体设计 |
2.1 线上识字教学策略教学理念 |
2.2 线上识字教学策略的特点 |
2.3 线上识字教学策略的教学目标 |
2.4 线上识字教学策略的教学过程 |
第3章 第一教学阶段线上识字教学策略实践过程及问题分析 |
3.1 课堂教学案例 |
3.2 教学实践中存在的问题及分析 |
第4章 第二教学阶段线上识字教学策略改良探索 |
4.1 课件制作——突出汉字 |
4.2 课堂组织——增加趣味认读练习 |
4.3 教学内容——生字重组生成新句子 |
4.4 作业布置——增加键盘输入作业新要求 |
4.5 课堂测试——快速得到反馈 |
第5章 第一教学阶段和第二教学阶段教学效果对比分析 |
5.1 第一教学阶段键盘输入汉字测试结果分析 |
5.1.1 测试结果统计 |
5.1.2 学生测试中存在的问题 |
5.1.3 教学反思 |
5.2 第二教学阶段键盘输入汉字测试结果分析 |
5.2.1 测试结果统计 |
5.2.2 学生存在的问题 |
5.2.3 教学反思 |
5.3 汉字认读课堂测试结果分析 |
5.3.1 第一教学阶段课堂测试结果统计及分析 |
5.3.2 第二教学阶段测试结果统计及分析 |
第6章 关于线上识字教学策略的思考 |
6.1 关于教学理念的思考 |
6.2 关于教学方法和教学策略的思考 |
第7章 结语 |
参考文献 |
致谢 |
(3)中文词语的语义表征与学习研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究历史现状及问题 |
1.2.1 面向字母语言的词语表征算法 |
1.2.2 基于中文特性的词语表征算法 |
1.3 本文的主要贡献与创新 |
1.4 本论文的结构安排 |
第二章 词语表征算法基础 |
2.1 表征学习相关基础知识 |
2.1.1 词语表示方法 |
2.1.2 语言模型 |
2.2 面向字母语言的词语表征算法 |
2.2.1 基于滑动窗口的词语表征算法 |
2.2.2 基于动态上下文信息的词语表征算法 |
2.2.3 基于图模型的词语表征算法 |
2.3 中文词语表征算法 |
2.3.1 引入细粒度特征的中文词语表征算法 |
2.3.2 引入图像特征的中文词语表征算法 |
2.3.3 中文词向量表征和学习研究面临的问题 |
2.4 本章小结 |
第三章 基于全局邻居图的中文词语表征算法 |
3.1 问题描述 |
3.2 方法介绍 |
3.2.1 方法总览 |
3.2.2 构造全局语义邻居图 |
3.2.3 软采样 |
3.2.4 全局语义邻居算法 |
3.2.5 空间和时间复杂度分析 |
3.3 实验验证 |
3.3.1 实验设置 |
3.3.2 实验结果 |
3.4 本章小结 |
第四章 基于多粒度特征的中文词语表征算法 |
4.1 问题描述 |
4.2 方法介绍 |
4.2.1 方法总览 |
4.2.2 基于高阶组合特征的JCWE算法 |
4.2.3 鲁棒性中文词语表征算法 |
4.2.4 空间和时间复杂度分析 |
4.3 实验验证 |
4.3.1 实验设置 |
4.3.2 实验结果 |
4.4 本章小结 |
第五章 全文总结与展望 |
5.1 全文总结 |
5.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(4)多点触控设备上适用于盲人和盲操作的中文输入技术研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 本文研究的主要目的 |
1.3 论文的组织结构 |
第二章 相关研究 |
2.1 基于盲文的盲输入的技术研究 |
2.2 基于非盲文的盲输入的技术研究 |
2.3 手指识别的技术研究 |
2.4 多点触控手势的研究 |
第三章 软件及文本输入操作基础理论 |
3.1 Windows消息机制与HOOK过程 |
3.2 Windows环境下的输入法框架 |
3.3 Windows进程间通信 |
3.3.1 剪贴板通信 |
3.3.2 消息 |
3.4 文本输入技术的性能指标 |
3.4.1 输入速率 |
3.4.2 错误率 |
3.5 多点触控设备上适用于盲人和盲操作的文本输入方法 |
3.5.1 手指识别算法 |
3.5.2 输入操作 |
第四章 支持盲人进行中文输入的语音提示 |
4.1 中文拼音输入法的输入流程 |
4.2 支持输入法语音提示的软件框架 |
4.2.1 扩展词数据库 |
4.2.2 输入法候选列表拦截插件 |
4.2.3 实验程序 |
4.3 实验设计及实验结果 |
4.4 小结 |
第五章 多点触控设备上支持中文盲输入的技术 |
5.1 技术设计 |
5.1.1 数字选择操作 |
5.1.2 翻页操作 |
5.1.3 其他操作 |
5.2 实验设计 |
5.2.1 实验设备、软件和参与人员 |
5.2.2 实验设计和实验任务 |
5.2.3 实验过程 |
5.3 结果分析 |
5.3.1 输入速率 |
5.3.2 未修正错误率 |
5.3.3 修正错误率 |
5.3.4 其他分析结果 |
5.3.5 主观调查 |
5.4 小结 |
第六章 Touch Forward与模拟Talk Back的对比实验 |
6.1 实验设计 |
6.1.1 实验设备、软件和参与人员 |
6.1.2 实验设计和实验任务 |
6.1.3 实验过程 |
6.2 结果分析 |
6.2.1 输入速率 |
6.2.2 未修正错误率 |
6.2.3 修正错误率 |
6.2.4 主观调查 |
6.3 小结 |
第七章 总结和展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录 |
致谢 |
(5)面向包容性的人机交互界面评估与优化方法研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 引言 |
1.1 研究背景 |
1.2 人机交互界面包容性的缺失问题 |
1.3 研究目标和挑战 |
1.4 研究思路与内容 |
1.5 主要创新点 |
1.6 论文组织结构 |
2 相关研究综述 |
2.1 用户能力类型 |
2.2 人机交互界面的包容性 |
2.3 人机交互界面的可用性 |
2.4 人机交互过程中的认知负荷研究 |
2.5 面向特殊用户群体的人机交互界面设计与优化 |
2.6 本章小结 |
3 基于可用性和用户能力的人机交互界面包容性评估方法 |
3.1 人机交互界面包容性的定义与评估指标 |
3.1.1 人机交互界面包容性的定义 |
3.1.2 人机交互界面包容性的评估指标 |
3.2 人机交互界面包容性的评估依据 |
3.2.1 人机交互界面的可用性 |
3.2.2 用户能力 |
3.3 基于可用性-用户能力函数的包容性计算 |
3.3.1 可用性-用户能力函数 |
3.3.2 可用性-用户能力函数与包容性评估指标的关系 |
3.3.3 包容性评估指标的计算 |
3.4 实验:非物质文化遗产网站人机交互界面的包容性计算 |
3.4.1 实验准备 |
3.4.2 实验结果和分析 |
3.5 本章小结 |
4 基于认知负荷的人机交互界面包容性影响因素研究 |
4.1 认知负荷分析方法 |
4.1.1 人机交互中认知负荷与交互界面包容性的关系 |
4.1.2 认知负荷测量方法 |
4.2 实验研究:非物质文化遗产网站人机交互界面的认知负荷分析 |
4.2.1 实验准备 |
4.2.2 影响非遗网站交互界面认知负荷的整体特征分析 |
4.2.3 影响非遗网站交互界面认知负荷的局部特征分析 |
4.2.4 影响非遗网站交互界面包容性的界面设计特征 |
4.3 实验研究:数控机床控制面板人机交互界面的认知负荷分析 |
4.3.1 数控机床控制面板人机交互界面方案决策问题 |
4.3.2 实验准备 |
4.3.3 实验结果和分析 |
4.3.4 影响数控机床控制面板交互界面包容性的界面设计特征 |
4.4 实验研究:智能电视人机交互界面的认知负荷分析 |
4.4.1 提高智能电视人机交互界面包容性的优化需求 |
4.4.2 实验准备 |
4.4.3 三种典型资源搜索交互界面的认知负荷分析 |
4.4.4 智能电视购物交互界面的认知负荷分析 |
4.4.5 影响老年用户智能电视交互界面包容性的界面设计特征 |
4.5 提高包容性的人机交互界面设计模式 |
4.5.1 降低知识搜索负荷的人机交互界面设计模式 |
4.5.2 提升用户注意力的人机交互界面设计模式 |
4.5.3 提高人机交互界面包容性的界面视觉元素设计模式 |
4.6 本章小结 |
5 基于知识图谱的高包容性人机交互界面优化设计方法 |
5.1 知识服务类网站人机交互界面的包容性问题 |
5.2 非物质文化遗产知识抽取 |
5.2.1 实体和关系类型定义 |
5.2.2 实体识别 |
5.2.3 关系抽取 |
5.2.4 端到端生成知识图谱 |
5.2.5 知识抽取效果 |
5.3 非遗知识图谱可视化网站 |
5.4 评估实验:知识图谱非遗网站人机交互界面的包容性评估 |
5.4.1 实验准备 |
5.4.2 实验结果和分析 |
5.5 本章小结 |
6 总结与展望 |
参考文献 |
作者简历及在学研究成果 |
学位论文数据集 |
(6)面向触控移动设备的文本交互研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 触控移动设备上文本交互技术国内外研究现状分析 |
1.2.1 中文文本输入国内外研究现状分析 |
1.2.2 文本选择国内外研究现状分析 |
1.2.3 文本操作国内外研究现状分析 |
1.3 研究内容 |
1.4 论文结构 |
第二章 触控移动设备文本交互相关技术 |
2.1 文本输入相关技术 |
2.1.1 基于虚拟键盘的文本输入方式 |
2.1.2 基于手写识别的文本输入方式 |
2.1.3 基于语音识别的文本输入方式 |
2.2 文本选择技术研究与介绍 |
2.2.1 基于句柄的文本选择方式 |
2.2.2 利用手势进行文本选择 |
2.2.3 利用感应增强进行文本选择 |
2.3 文本操作技术研究与介绍 |
2.3.1 菜单弹出式文本操作方式 |
2.3.2 基于手势的文本交互方式 |
2.3.3 径向菜单介绍 |
第三章 新型文本输入交互技术设计 |
3.1 中文文本输入简介与问题分析 |
3.1.1 基于汉字拼音的文本输入法介绍与分析 |
3.1.2 基于汉字字形的文本输入法介绍与分析 |
3.1.3 基于语音的汉字输入法 |
3.2 研究思路 |
3.3 新的汉字文本输入交互流程 |
3.4 通过一美元算法实现笔画识别 |
3.5 实验设计与流程 |
3.5.1 实验目的 |
3.5.2 实验设备 |
3.5.3 实验设计 |
3.6 实验数据分析 |
3.6.1 学习效应分析 |
3.6.2 输入时间分析 |
3.6.3 用户主观偏好分析 |
3.7 本章小结 |
第四章 新型文本选择交互技术设计 |
4.1 目前主流文本选择方式简介与问题分析 |
4.2 研究思路 |
4.3 新的文本选择交互流程 |
4.4 系统实现 |
4.4.1 文本选择系统状态分类与转换 |
4.4.2 系统核心功能实现 |
4.5 实验介绍及流程 |
4.5.1 实验目的 |
4.5.2 实验设备 |
4.5.3 实验人员 |
4.5.4 实验设计 |
4.6 实验数据分析 |
4.6.1 学习效果分析 |
4.6.2 选择时间分析 |
4.6.3 选择准确率分析 |
4.6.4 用户主观偏好分析 |
4.7 本章小结 |
第五章 新型文本操作交互技术设计 |
5.1 目前主流的文本操作方式介绍与问题分析 |
5.2 研究思路 |
5.3 新的文本操作交互流程 |
5.4 系统实现 |
5.4.1 系统状态分类与转换 |
5.4.2 核心功能实现 |
5.5 实验介绍及流程 |
5.5.1 实验目的 |
5.5.2 实验设备 |
5.5.3 实验人员 |
5.5.4 实验设计 |
5.6 实验数据分析 |
5.6.1 学习效应分析 |
5.6.2 文本操作时间分析 |
5.6.3 文本操作正确率分析 |
5.6.4 参与者主观偏好分析 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 成果与展望 |
参考文献 |
致谢 |
在学期间的研究成果以及发表的学术论文 |
(7)信息技术在听障学生书面语沟通能力提升中作用的个案研究(论文提纲范文)
摘要 |
Abstract |
1 引言 |
1.1 问题提出 |
1.2 概念界定 |
1.2.1 信息技术 |
1.2.2 书面语沟通 |
1.2.3 听觉障碍 |
1.3 研究综述 |
1.3.1 国内相关研究概述 |
1.3.2 国外关于信息技术在听障者书面语及其沟通方面的相关研究 |
2 研究设计 |
2.1 研究目的 |
2.2 研究意义 |
2.2.1 理论意义 |
2.2.2 实践意义 |
2.3 研究内容 |
2.4 研究对象 |
2.5 研究方法 |
2.5.1 文献研究法 |
2.5.2 个案研究法 |
2.6 分析方法 |
2.7 干预材料 |
2.8 研究过程 |
2.8.1 干预前的纸笔沟通(A) |
2.8.2 干预后的微信沟通(B) |
3 结果与讨论 |
3.1 结果 |
3.1.1 小雪在不同沟通模式下的书面语语病百分比分析 |
3.1.2 小巍在不同沟通模式下的书面语语病百分比分析 |
3.1.3 个案在不同沟通模式下的书面语语句总数分析 |
3.1.4 小结 |
3.2 讨论 |
3.2.1 “了”字的错误使用阻碍了书面语的顺畅沟通 |
3.2.2 丰富生动的图片能促进听障学生书面语的表达 |
3.2.3 电子输入法打字时错别字的出现率为0 |
3.2.4 小结 |
4 结论与建议 |
4.1 结论 |
4.1.1 影响书面语沟通质量的因素:“了”字的错误使用导致时态混乱 |
4.1.2 影响手机微信沟通速度的因素:拼音的使用对于听障学生是个不小的挑战 |
4.1.3 相比较于纸笔沟通,借助信息技术手段来进行书面语沟通的优势 |
4.2 建议 |
4.2.1 鼓励听障学生借助电子产品进行书面语沟通 |
4.2.2 规范听障学生手语和书面语的表达 |
4.2.3 支持听障学生用手写输入法打字 |
4.2.4 重视对听障学生信息技术课程的教学 |
4.2.5 借助现代多媒体技术教学《沟通与交往》课程 |
5 反思与展望 |
5.1 反思 |
5.1.1 沟通主题的选择 |
5.1.2 沟通过程中的反馈 |
5.1.3 沟通时段的限制 |
5.1.4 个案沟通时自身的状态 |
5.1.5 变量的控制 |
5.2 展望 |
参考文献 |
致谢 |
(8)基于深度学习的文本校对方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究的背景和意义 |
1.2 研究现状 |
1.3 研究内容 |
1.4 文章组织结构 |
第二章 相关技术概述 |
2.1 文本校对概述 |
2.2 基于统计和规则结合的文本校对方法 |
2.2.1 基于N-gram语言模型的方法 |
2.2.2 基于散串的方法 |
2.2.3 基于语义搭配的方法 |
2.2.4 N-gram和散串结合的文本查错方法 |
2.3 基于深度学习的文本校对方法 |
2.3.1 序列标注问题 |
2.3.2 词嵌入 |
2.3.3 长短时记忆网络 |
2.3.4 条件随机场 |
2.4 两类校对方法对比 |
2.5 本章小结 |
第三章 基于BLSTM-CRF的字词查错方法 |
3.1 传统中文字词错误校对存在问题 |
3.2 中文文本字词错误特征 |
3.2.1 错误来源 |
3.2.2 错误分类 |
3.2.3 错误分布 |
3.3 BLSTM-CRF字词错误检查模型 |
3.3.1 LSTM单元 |
3.3.2 双向LSTM单元 |
3.3.3 CRF单元 |
3.4 模型训练 |
3.5 实验与分析 |
3.5.1 实验数据 |
3.5.2 参数设置 |
3.5.3 评价指标 |
3.5.4 实验结果 |
3.6 本章小结 |
第四章 基于多特征融合的字词查错方法 |
4.1 引言 |
4.2 相关研究 |
4.3 模型 |
4.3.1 Embedding层 |
4.3.2 LSTM |
4.3.3 网格LSTM |
4.3.4 CRF |
4.4 解码和训练 |
4.5 实验与分析 |
4.5.1 实验数据 |
4.5.2 预训练词向量 |
4.5.3 参数设置 |
4.5.4 实验结果 |
4.5.5 性能影响分析 |
4.5.6 案例分析 |
4.6 本章小结 |
第五章 结论与展望 |
5.1 主要结论 |
5.2 研究展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(9)深度学习语音识别系统中的自适应方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 深度学习语音识别技术研究现状 |
1.2.2 声学模型自适应技术研究现状 |
1.2.3 语言模型自适应技术研究现状 |
1.3 本文主要内容及组织结构 |
第2章 声学模型在线自适应方法研究 |
2.1 引言 |
2.2 基于注意力机制的声学模型在线自适应方法的基本框架 |
2.2.1 主体神经网络 |
2.2.2 外部记忆单元 |
2.2.3 注意力模块 |
2.2.4 连接模块 |
2.3 基于注意力机制的声学模型在线自适应方法的改进方案 |
2.3.1 基于音素信息的记忆向量构建方式 |
2.3.2 基于变长编码的说话人信息收集方式 |
2.3.3 基于多级门控机制的说话人向量连接方式 |
2.3.4 基于辅助说话人分类任务的信息增强方式 |
2.4 实验结果及分析 |
2.4.1 实验数据及基线配置介绍 |
2.4.2 在线自适应方案的实验验证 |
2.5 本章小结 |
第3章 低资源下的声学模型离线自适应技术研究 |
3.1 引言 |
3.2 基于多任务学习的Speaker Code方法 |
3.2.1 SpeakerCode自适应方法介绍和分析 |
3.2.2 基于多任务学习的Speaker Code方法 |
3.3 基于SVD和VQ的自适应方法 |
3.3.1 基于SVD的模型自适应 |
3.3.2 矢量量化及训练 |
3.4 实验及分析 |
3.4.1 实验数据集及基线模型概述 |
3.4.2 基于多任务学习的Speaker Code方法实验 |
3.4.3 基于SVD和VQ的自适应方法实验 |
3.5 本章小结 |
第4章 无监督声学模型离线自适应技术研究 |
4.1 引言 |
4.2 机器自动标注准确率提升方法 |
4.2.1 基于用户确认文本的机器标注准确率提升方法 |
4.2.2 基于确认模型的声学置信度方法 |
4.3 基于元学习的自适应方法 |
4.3.1 MAML技术介绍 |
4.3.2 基于MAML的无监督说话人自适应 |
4.4 实验及分析 |
4.4.1 实验数据集及基线模型概述 |
4.4.2 基于用户确认文本的机器标注方法相关实验 |
4.4.3 基于确认模型的置信度方法相关实验 |
4.4.4 基于MAML的自适应方法相关实验 |
4.5 本章小结 |
第5章 语言模型自适应方法研究 |
5.1 引言 |
5.2 基于用户修改词的N-gram语言模型自适应 |
5.2.1 基于用户行为分析的用户词挖掘 |
5.2.2 用户词动态激励 |
5.3 基于聚类的神经网络语言模型自适应 |
5.3.1 无监督自聚类 |
5.3.2 多类联合语言模型 |
5.4 实验及分析 |
5.4.1 实验数据集及基线模型概述 |
5.4.2 基于用户修改词的N-gram语言模型自适应相关实验 |
5.4.3 基于聚类的神经网络语言模型自适应相关实验 |
5.5 本章小结 |
第6章 语音识别自适应的应用 |
6.1 引言 |
6.2 声学模型自适应的应用 |
6.3 语言模型自适应的应用 |
6.4 本章小结 |
第7章 总结 |
7.1 本文的主要贡献与创新点 |
7.2 后续的研究工作 |
参考文献 |
在读期间发表的学术论文与取得的研究成果 |
致谢 |
(10)基于神经网络的带有拼写纠错功能的音字转换模型(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 拼音输入法纠错算法研究现状 |
1.3.2 基于机器学习方法的句子语法纠错模型研究现状 |
1.4 研究内容 |
1.5 论文结构 |
第二章 相关技术介绍 |
2.1 自然语言处理中常用的深度学习模型 |
2.1.1 循环神经网络 |
2.1.2 LSTM网络 |
2.1.3 词嵌入技术 |
2.2 Seq2seq模型 |
2.3 Attention机制 |
2.4 自编码网络Autoencoder |
2.5 集束搜索Beam Search算法 |
2.6 本章小结 |
第三章 基于神经网络的拼音拼写纠错模型KNPTC |
3.1 现有拼音纠错算法的局限性及解决办法 |
3.2 拼音输入法用户输入序列特点分析 |
3.2.1 较短长度带来的有限信息量 |
3.2.2 拼音输入中存在多种错误类型 |
3.2.3 用户输入和拼音输出之间存在相对固定的先后顺序关系 |
3.3 基于神经网络机器翻译的拼写纠错模型 |
3.3.1 模型整体架构 |
3.3.2 按键转移概率提取 |
3.3.3 Attention机制的有监督训练 |
3.3.4 使用对齐矩阵对Attention机制进行有监督训练 |
3.4 实验验证 |
3.4.1 实验数据获取 |
3.4.2 模型的评价指标 |
3.4.3 对比试验 |
3.4.4 实验环境 |
3.4.5 实验结果及分析 |
3.5 本章小结 |
第四章 样本先验知识与纠错模型相结合 |
4.1 用户点击位置信息与纠错模型结合模型KN PTC+ |
4.1.1 输入法中点击位置与错误率之间的关系 |
4.1.2 使用Autoencoder网络获得点击位置的向量表达 |
4.1.3 将点击位置先验信息引入神经网络 |
4.1.4 实验环境 |
4.1.5 实验结果及分析 |
4.2 预测结果重排序模型RankModel |
4.2.1 需求分析及RankModel算法选择 |
4.2.2 RankModel与纠错模型结合结构图 |
4.2.3 实验数据获取及特征处理 |
4.2.4 实验环境及排序模型的训练 |
4.2.5 模型评价指标 |
4.2.6 实验结果及分析 |
4.3 本章小节 |
第五章 带有拼写纠错功能的拼音输入法系统 |
5.1 输入法系统整体结构图 |
5.2 基于隐马尔可夫的拼音汉字转换模型MBPTM |
5.2.1 隐马尔可夫模型 |
5.2.2 基于隐马尔可夫模型的拼音向汉字转换模型 |
5.3 实验数据获取 |
5.4 系统实现 |
5.4.1 加载拼音和汉字相关信息 |
5.4.2 构建隐马尔可夫模型对象 |
5.4.3 遍历测试数据并构建隐马尔可夫模型进行预测 |
5.5 系统功能测试 |
5.5.1 输入法系统纠错功能测试 |
5.5.2 输入法系统拼音向汉字转换功能测试 |
5.5.3 输入法系统测试结果 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 后续工作及展望 |
参考文献 |
附录1 隐马尔可夫模型实现和预测代码片段 |
致谢 |
攻读学位期间发表的学术论文目录 |
四、四种拼音输入法的特点介绍(论文参考文献)
- [1]中文文本校对语料库自动生成技术研究[D]. 潘利健. 北方工业大学, 2021(01)
- [2]面向马来西亚零基础汉语学习者的线上识字教学策略初探[D]. 李阁. 兰州大学, 2021(02)
- [3]中文词语的语义表征与学习研究[D]. 许璁. 电子科技大学, 2021(01)
- [4]多点触控设备上适用于盲人和盲操作的中文输入技术研究[D]. 崔明远. 兰州大学, 2021(09)
- [5]面向包容性的人机交互界面评估与优化方法研究[D]. 窦金花. 北京科技大学, 2020(01)
- [6]面向触控移动设备的文本交互研究[D]. 桓维阳. 南京航空航天大学, 2020(07)
- [7]信息技术在听障学生书面语沟通能力提升中作用的个案研究[D]. 蔡欢. 华中师范大学, 2020(02)
- [8]基于深度学习的文本校对方法研究[D]. 王冰. 北方工业大学, 2020(02)
- [9]深度学习语音识别系统中的自适应方法研究[D]. 潘嘉. 中国科学技术大学, 2020(01)
- [10]基于神经网络的带有拼写纠错功能的音字转换模型[D]. 纪兴光. 北京邮电大学, 2019(09)