一、支持向量机增量学习的算法与应用(论文文献综述)
周林寰[1](2021)在《一类支持向量机在线算法及其应用》文中进行了进一步梳理支持向量机(SVM)是一种经典的分类技术,以其高效的性能在各个领域都得到了十分广泛的使用。然而,随着数据规模的不断增大,实时地处理数据的需求越来越迫切,传统支持向量机的算法在计算效率和成本上遇到了瓶颈。为了解决这个问题,本文首先利用外点惩罚函数法将支持向量机的原始最优化问题转换为无约束优化问题,再应用随机邻近梯度法进行求解,从而获得支持向量机的在线算法(SPG-SVM)。根据更新迭代使用的数据量是单个数据还是小批次数据,将SPG-SVM分为SPG-SVM(单点)与SPG-SVM(批量)。然后基于Passive-Aggressive(PA)算法的思想,结合外点惩罚函数法将其优化问题转换为无约束优化问题,再应用随机邻近梯度法进行求解,从而获得在线算法(SPG-PA)。最后针对某省某运营商营销产品外呼购买情况数据集,将传统支持向量机SVM、SPG-SVM(单点)、SPG-SVM(批量)、PA和SPG-PA算法进行比较。结果表明在线算法相比于传统的离线算法在模型训练的运行时间上有十分明显的优势。同时关于营销产品购买情况的预测,SPG-SVM(单点)和SPG-SVM(批量)体现出了优良的性质。
曾京京[2](2021)在《大数据环境下支持向量机的泛化性能》文中指出机器学习的基本问题是利用模型对数据进行拟合,其目标是追求泛化能力.虽然深度学习被认为是机器学习发展史上的第二次浪潮,但深度学习一般需要大规模的训练数据,而实际应用中往往会遇到训练数据的规模相对较小的情形,这时采用支持向量机等浅层机器学习方法就可以很好地解决或处理.本文以支持向量机为突破口,对大数据环境下拉格朗日支持向量机、基于支持向量机的增量学习以及基于hinge损失的在线成对学习等进行了研究.主要研究内容与创新如下:(1)针对拉格朗日支持向量机,我们建立了基于一致遍历马氏链、强混合序列等非独立同分布样本情形下拉格朗日支持向量机的泛化界,得到了最优的收敛速率.作为应用,我们又建立了基于独立同分布样本情形下拉格朗日支持向量机的泛化界和收敛速率.(2)建立了独立同分布样本情形下,基于经典支持向量机、最小二乘支持向量机、拉格朗日支持向量机和结构支持向量机的增量学习的泛化界,得到了快的收敛速率.同时,我们还建立了一致遍历马氏链样本情形下,基于上述四种支持向量机的增量学习的泛化界和快的收敛速率.(3)建立了几何β-混合序列、V-几何遍历马氏链和一致遍历马氏链等样本情形下,基于hinge损失函数的在线成对支持向量机算法的泛化界,得到了快的收敛速率.作为指数强混合序列的特殊情况,我们又建立了独立同分布样本情形下,基于hinge损失函数在线成对支持向量机算法的泛化界,并得到了快的收敛速率.在理论研究基础上,我们提出了一种基于马氏选择性抽样的在线成对支持向量机算法.基于公共数据库的实验结果表明,相对于经典在线成对支持向量机算法而言,本文提出的基于马氏选择性抽样的在线成对支持向量机算法不仅有更小的错分率,而且抽样与训练总时间更少.
刘铭宇[3](2020)在《面向数据流的类增量学习技术研究》文中研究说明类增量学习技术在近年来逐渐成为机器学习领域的研究热点,其技术特点是在增量学习过程中随着数据规模的持续扩大,数据类别也随之增长。其中,面向高速动态数据流的类增量学习技术的研究,更是在诸如数据流异常检测、网络入侵检测、系统异常诊断和金融市场行为监控等现实场景存在较为迫切的应用需求。然而,流式数据模型具有数据分布动态变化、数据流速快、数据规模大且维度高等特点,给面向数据流的类增量学习技术提出了新的更大挑战:第一,在类增量学习过程中,实时到达的新类数据的规模较小,导致新类数据与已有类别数据之间出现分布不平衡的问题,严重影响数据流类增量学习的分类准确性;第二,由于数据流通常具有持续高速到达的特点,类增量学习需要对数据进行实时处理。过多访问历史数据,会严重影响面向数据流的类增量学习的实时性;第三,真实的应用数据通常呈现大规模及高维度的特性,与数据流的特点相结合,存在对大规模高维度数据实时处理困难、增量学习复杂的现象。针对上述挑战,本文对不平衡数据样例生成算法、层级嵌套算法进行了深入研究,以满足类增量学习精准和高效的现实需求,并在网络流异常检测领域对提出的基于代价敏感支持向量机的中心扩散式类增量学习算法进行验证,取得的主要研究成果如下:对不平衡数据的处理是面向数据流的类增量学习技术的基础。现有的类不平衡学习算法,大多集中于处理静态数据集的分类任务,并且利用数据间的距离来拓展潜在数据,容易造成无效信息的过拟合现象而导致不够泛化,从而影响类增量学习的准确性。为此,本文提出了一种基于中心扩散式的样例生成增强算法Cd IGAB(Central-diffused Instance Generation Algorithm embedded Boosting)。该算法以新类数据样例的中心为起点进行随机方向向量的扩散,以达到扩大该少数类(Minority Class)数据样例分布的目的,并有效降低类不平衡率。在此基础之上,我们将上述样例生成方案与自适应增强算法Ada Boosting.M2相结合,为迭代中被错误分类的数据样例分配不等的权重,从而减少最终集成结果中的方差和偏差。由于在每一轮迭代中引入了具有差异性的样例生成方案,为少数类提供了更为泛化的决策区域,显着增加了集成中分类器之间的多样性,有效保证类增量学习的准确性。实验结果表明,相较于经典的SMOTE、OPCIL和SDCIL算法,Cd IGAB能够对新类数据的分布进行更好的拟合,其对应的分类准确率(Overall Accuracy)平均提升10.34%,同时更关注少数类的Macro-F1指标也平均提升13.13%。在数据流场景下降低对历史数据的依赖程度,保证类增量学习过程的准确性与高效性,是面向数据流的类增量学习算法的关键。当前研究中类增量学习算法对历史数据的依赖较严重,往往需要多次访问历史数据或存储大量历史数据,面对大规模的流式数据时,处理的效率会大大降低。为此,本文提出一种基于单类支持向量机的层级嵌套算法ONHA(OCSVM based Nested Hierarchy Algorithm)。该算法借助OCSVM算法较为良好的泛化性,通过重复使用支持向量筛选核心关键样例,来消除冗余样例,进而更新全部模型,使分类模型具备良好的数据拟合能力。随着新类数据的不断到达,ONHA算法会构建一种层级嵌套结构式的分类模型。实验结果表明,与SDCIL、HSCIL和OPCIL等典型类增量学习算法相比,历史数据存储量可以平均降低70%,同时训练时间开销降低40%左右。针对高维度数据流环境中数据实时处理困难的问题,为进一步提高类增量学习训练效率,本文将样例生成增强算法Cd IGAB与层级嵌套算法ONHA做出相应的调整并加以结合,提出基于代价敏感支持向量机的中心扩散式数据流类增量学习算法Cd CIL(Central-diffused Class Incremental Learning based on C-SVM over Data Stream)。该算法通过采用随机维度扩散的方式,降低高维度数据所导致的负面效果;同时加入使用具备动态适应能力的代价敏感支持向量机,对数据流各个类别设置不同的代价敏感因子,增强层级嵌套模型的更新效果,防止高维度数据流所导致的模型过拟合问题,最终保证面向高维度数据流的类增量学习算法的准确性和高效性。实验结果表明,在网络流异常检测领域,Cd CIL算法能有效适应高维度数据流,对数据进行实时处理,保证面向高维度数据流的类增量学习的准确性和高效性,类增量学习训练时间开销平均减少33.2%,控制算法分类性能平均降低在6%以内。
陈鑫磊[4](2019)在《基于半监督支持向量机的电力系统暂态稳定评估》文中指出现代电力系统动态行为日益复杂,传统电力系统暂态稳定评估方法以数学模型为核心,无法满足在线评估的需求。尽管基于监督式支持向量机的暂态稳定评估方法能实现在线评估,但仍存在模型泛化能力不强,对实际系统适应性差以及缺乏在线学习能力等问题。本文研究基于半监督支持向量机的电力系统暂态稳定评估方法以改善现有方法的不足,主要研究内容如下:针对现有安全域概念下基于监督式支持向量机的暂态稳定评估方法仅利用离线时域仿真获取样本数据训练得到的评估模型泛化能力有限以及将所有训练样本在目标函数中同等对待使其分界面易受异常值干扰的问题,本文提出一种基于半监督模糊孪生支持向量机的电力系统暂态稳定评估方法。该方法采用故障发生前的稳态潮流数据构成原始特征集,通过拉普拉斯分值法和主元分析法对特征集进行筛选和压缩以获得与系统稳定性强相关的特征子集。为充分挖掘隐含在无标签样本中的信息,在孪生支持向量机的目标函数中增加描述未标记样本分布的拉普拉斯正则项以实现半监督学习。同时构建能够正确区分支持向量与异值点的新的模糊隶属度函数。在此基础上形成模糊半监督孪生支持向量机模型并利用该模型对降维后的有标签样本和无标样本同时进行分类,采用鲸鱼优化算法对模型参数进行选择优化。以WSCC-9节点系统和IEEE-39节点系统作为仿真算例,计算结果表明所提方法比传统监督式支持向量机的暂稳评估方法在泛化能力和预测精度方面有所提高。针对现有稳定域概念下基于监督式支持向量机的暂态稳定评估方法存在模型不能在线更新,对电力系统复杂多变的动态环境适应能力差以及模型参数优化时间长等问题,本文将增量学习和减量学习与直推式学习相结合,提出一种基于在线自适应直推式支持向量机的电力系统暂态稳定评估方法。该方法不仅能在故障发生时对系统的暂态稳定性做出预测,而且同时可以利用新增样本实现模型自我更新与修正,以及能够通过参数摄动对模型进行自适应优化。最后以IEEE-68节点系统为例验证了所提方法的可行性和有效性。仿真结果表明所提方法比传统批量归纳式方法训练得到的评估模型准确率更高,评估时间在毫秒级且参数优化时间相比于完整优化提升了近5倍,满足在线暂态稳定评估的需求。
夏爽[5](2019)在《基于在线学习支持向量机的中国股票市场价格预测研究》文中认为传统的支持向量机算法处理数据的方式是批量式的,重复对所有数据进行分类学习,当面对如今股票市场频繁更新的海量数据时,可能会导致更高的时间空间资源需求。而在线学习的核心思想就是突破传统批量式学习方式,通过不断更新的新数据,对模型展开训练,进行不断地调优,使其快速准确的反映数据变化,提高预测精度。通过阅读文献,我们发现这种支持向量机的批量式分类算法在线化,有在生物、医药、工程等项目上得到部分应用,但还并未在金融市场上广泛传播。所以,本文对在线学习与支持向量机算法的结合展开研究,用于对股票市场进行预测。本文先对相关文献进行了研究,对在线学习的理论和实现方式,对支持向量机应用于金融市场的方法进行了回顾、总结。相比于普通的支持向量机(supportvectormachine,SVM),最小二乘支持向量机(least squares support vector machine,LSSVM)把不等式约束转化为等式约束,从而降低了拉格朗日乘子alpha的求解复杂性,具有较快的求解效率,但也失去了解的稀疏性,所以,为了解决该问题,本文选择在线学习方法对最小二乘支持向量机进行改进,通过数学推导构建模型。利用构建的新算法模型先与LSSVM就招商银行的过去股价信息进行测试对比,通过训练找到最优的核参数和核函数——径向基核函数,并得到改进的模型预测效果要优于LSSVM的结论,然后按照选出的最优核函数通过在线学习LSSVM算法对大中小盘三种行业共9只股票进行最优参数选择和实证。文章最后对实证结果和全文内容进行了总结:(1)新模型能较好把握股票未来的涨跌趋势;(2)新模型预测效果有一定延迟;(3)预测值的波动较实际值大;(4)不同量级股票之间预测存在差异。同时,对模型未来的应用和扩展提出了一些见解:(1)扩大样本选择的种类和范围;(2)使用不同的特征向量、数据处理、核参数寻优等方法以验证模型适应性;(3)依据新模型构建量化方法和投资策略。
宿绍勋[6](2019)在《基于SVM文本分类的传销识别研究》文中指出网络传销是一种基于互联网传播平台的新型传销形式,具有隐蔽性强、欺骗性强、涉案范围广、传播速度快等特点。网络传销扰乱了互联网的良好秩序,破坏了市场经济的健康发展,造成了诚信危机,严重影响了社会和谐稳定。网络传销的犯罪手段多种多样,往往是利用互联网发布信息进行“宣传推广”。文本是网络传销活动中使用最广的信息形式之一。数据挖掘技术在网络舆情分析中广泛应用,然而数据挖掘在传销识别方面却鲜有应用。传销组织的文本和正常公司的文本有所差别。因此,本文提出通过文本分类的方法对网络文本中的网络传销公司或者团体进行识别。基于支持向量机的文本分类是目前主流的文本分类方案之一。本文通过研究传销组织的文本,结合传销文本的特性对基于支持向量机的文本分类方案进行优化改进。在本文中,传销文本识别本质上是一项文本分类任务。针对传销文本的特点进行分析和总结,并结合这些特点对基于支持向量机的文本分类方案进行优化和改进是本文研究重点之一。此外,本文还针对支持向量机算法在传销文本识别任务中的改进做了一些研究。本文的主要研究工作与成果如下:(1)提出了一种包含特征的类别分布信息的特征加权算法。针对传统特征加权算法忽视类别信息的缺点,该算法利用特征在类别间的分布差异对传统特征加权算法进行改进。该算法通过给类别区分能力更强的特征赋予更高权重,提高识别传销文本的准确度。(2)提出一种新的用于二分类问题的文本表示模型,主题向量空间模型。在此基础上,本文将主题向量空间模型与传销特征结合,提出了具体的用于识别传销文本的传销主题向量空间模型。本文设计实验证明传销主题向量空间模型比传统向量空间模型在识别传销文本任务中有更好的表现。(3)将增量学习方案应用在构建支持向量机分类器中。针对支持向量机分类器在新的训练样本加入时需要重新构建模型的不足,本文引入了支持向量机的增量学习方案。增量学习方案能够大大减少了加入新的训练样本时构建模型的计算量,提高识别传销文本的性能。
刘康炜[7](2019)在《基于数据驱动的危化品事故分析预警关键技术研究》文中研究指明以石油化工为代表的危险化学品(以下简称“危化品”)行业属于高危行业,具有高温、高压、有毒、有害、易燃、易爆等特点。随着危险化学品行业向着规模化、大型化、集约化发展,一旦发生事故,将会造成惨重的经济损失,严重的环境灾难和恶劣的社会影响。事故预警的准确性、实时性、有效性已经严重影响了我国危化品行业的快速发展。惨痛的事故经历告诫我们,应通过对历史事故的分析、研究,建立预警和预防体系,预防事故发生、减少事故损失,实现危化品行业和谐发展、科学发展。本文针对危化品事故频发的现状,研究了危化品事故分析预警的一系列关键技术,强调了数据在事故分析预警中的重要性,提出了一套从危化品事故数据收集、处理、存储,到危化品事故分析、提炼、表达,再到危化品事故预警模型的构建、反馈、验证的完整的基于数据驱动的危化品事故分析预警方法,并将此方法应用于工程实践,开发建设了危化品事故预警与防控平台,应用于多地应急管理厅和安监机构,取得了良好的社会和经济效益。分析了导致危化品事故发生的关键因素——人的不安全行为、物的不安全状态、环境的不确定影响;针对目前危化品事故数据采集缺失的现状,研发集成了异常行为智能识别的危化品事故数据采集物联网关,实现上述三个要素的数据采集。特别针对化工企业现场人员行为特征,利用监控视频从颜色矩、边缘直方图描述符、颜色和边缘方向性描述符、颜色布局描述符和可伸缩颜色描述符五个方面进行特征提取,并采用局部二值拟合模型(LBF)来最终识别异常事件。通过对危化品事故主数据的存储管理设计,为后续事故分析预警奠定数据基础。分析了传统建立在因果关系基础之上的事故分析方法存在的弊端,提出了事故状态向量的概念,将事故状态向量化,解决了事故定量表达的问题。为确定向量的维度、维度的形式、维度之间的关系,构建危化品安全知识本体模型,对分散的多源异构数据进行整合分析和标准化处理,并进行实体和关系抽取,建立起危化品事故知识图谱。挖掘导致危化品事故发生因素之间的关联关系,形成全面的、可量化的危化品事故状态向量。与传统因果关系分析方法相比,保留了可能导致事故发生的全部因素,增加了事故表达的全面性。在事故状态向量的基础上,利用改进的支持向量机算法的学习能力和良好的泛化能力,构建危化品事故分析预警模型。针对传统支持向量机增量学习算法存在丢失支持向量的问题,提出了基于状态向量距离的增量学习改进算法,在保留了事故众多相关因素的同时,计算每个状态向量距离超平面的向量距离,有效判断事故状态向量的状态,预测结果准确率较高。针对危化品行业区域事故预警的需求,提出了基于核密度法的预警分布云图可视化方法,将单个企业预警扩展为区域预警,以动态云图进行直观展示,对危化品行业事故的预测预防具有积极意义。将以上研究成果应用于工程实践,建设了危险化学品事故预警与防控平台,提出了平台的“五层三体系”技术架构。在数据层面上,依托安监云工程,实现数据异地云统一存储,在安监云中构建国家、省、市、区县四级数据库,按照不同类型数据的采集频次要求,实现数据的逐级上传和存储。在应用层面上,开发部署国家、省、市、区县四级危化品事故预警与防控系统,面向不同级别监管机构的监管需求,实现对重点监管危化品企业安全事故预警和实时动态数据远程巡查、抽查,满足各级政府对危化品企业安全生产预警、监管、备查等需要。设计开发的危化品事故预警与防控平台在多地进行了行业示范,取得了良好的应用效果。
杨鹏伟[8](2019)在《分解算法应用和分位数回归》文中指出本文在支持向量机模型背景下,研究了各类分解算法及其应用。用基准数据集对最重要的SVMLight算法和SMO算法进行训练,并对不同核函数的实验结果进行比较;同时探讨针对不同的优化问题,如何选取合适的核函数。分位数回归是统计学和机器学习中的重要研究问题。本文在非一致抽样分布下,研究基于高斯核的在线分位数算法。通过引入阈值?到Pinball损失函数产生算法的稀疏性,用H¨older对偶空间刻画抽样分布的非一致性,然后通过误差分解和迭代方法推导算法的收敛速度。这里并以中位数回归为例,探讨如何在算法中选取参数,平衡其稀疏性和收敛阶;同时也指明本文的背景和数学方法适用于一般分位数回归。
王志杰[9](2019)在《基于集成增量动态权重组合的设备故障分类方法研究》文中研究说明随着工业物联网和信息技术的发展,制造业中的大型机械装备在生产过程中不断涌现出海量运行数据,通过运行数据快速高效地分析提取装备故障信息,并借助神经网络等算法实现对故障类型的有效诊断和预测,有效降低由于装备故障带来的停产损失或人员伤害事故,已经逐渐成为智能制造领域的研究热点。但是在生产过程中,由于工业设备本身特性,其产生的数据往往具有非平衡、高噪声等特点,并且随着设备运行数据的不断增多,设备故障诊断模型的精确度也会越来越低。针对上述问题,本研究根据工业设备状态数据的特征,以及工业生产环境的复杂性,提出一种基于集成增量动态权重组合的设备故障诊断分类模型,具体如下。第一,该模型通过研究不同分类器在不同环境下轴承设备的故障诊断分类效果,提出一种将长短期记忆人工神经网络(Long Short Term Memory,简称LSTM)与多分类的支持向量机(Support Vector Machine,简称SVM)进行组合的动态权重组合分类模型(Dynamic Weight Combination Classification Model Based on LSTM-SVM,简称DWCLS),用于解决在高噪声设备状态数据中的故障特征提取和分类问题。第二,在以上提出的基于LSTM-SVM动态权重组合分类模型的基础上,引入选择性集成增量学习机制和非平衡数据处理技术,用于解决海量非平衡设备状态数据下普遍存在的新增数据特征提取和分类以及样本类别不平衡问题。第三,将第一条研究内容和第二条研究内容进行融合,形成一种基于集成增量动态权重组合的设备故障诊断分类模型(Equipment Fault Diagnosis Classification Model Based on Integrated Incremental Dynamic Weight Combination,简称DWCMI),并通过实验证明该模型能够快速适应环境变化,可以有效解决设备故障诊断过程中的故障数据量过大、非平衡、高噪声、数据样本无法关联等问题。
曹雪[10](2019)在《基于增量集成学习的设备故障诊断方法研究》文中研究指明随着信息技术与工业制造的深度融合,设备运行过程中不断产生的海量状态数据被保留下来,使利用大数据分析的方法对设备故障进行有效识别和预测逐渐成为故障诊断领域的主流。但是,由于生产过程中设备运行状态随时间推进发生变化,原有故障类型被修复,而新增故障类型产生,传统的机器学习方法无法满足生产过程中设备运行状态实时变化的实际需求。将增量学习方法应用于故障诊断领域,能够不断地从增量数据中学习新的知识,同时保留大部分先前学习到的知识,能够有效的提高准确率、节约时间空间成本、减少计算量。但是由于设备运行中的增量状态数据存在海量、非平衡、高噪声、强因果关联等特点,若不对此进行处理将严重影响故障识别的准确率。针对上述问题,本研究根据设备运行状态数据的特点,在参考了大量国内外文献的基础上,提出一种基于增量信息的动态权重集成学习模型,该模型的创新之处主要体现于以下三个方面:(1)该模型针对增量状态数据的非平衡特性,提出一种基于样本分布信息的动态加权非平衡处理方法,动态调整样本权重,实现了对非平衡增量数据的实时处理。(2)考虑到随着时间推进,新增故障模式产生,而原有故障被修复的情况,提出一种集成学习基分类器动态评价机制对模型进行动态调整,舍弃分类准确率低、不适用于当前运行状态的基分类器,以适应设备运行状态的变化,有效提高分类模型的可靠性。(3)针对设备故障间存在强因果关联的特点,提出一种有效信息增益筛选策略,筛选更有价值的新增特征用于训练新的基分类器,并更新原有集成分类模型,实现增量信息融合,解决增量状态数据的故障模式诊断问题。通过实验证明本文研究方法能够有效的解决增量非平衡设备运行状态数据的故障诊断问题,利用非平衡数据处理方法消除了数据不平衡性对诊断准确率的消极影响,实现对非平衡增量样本的实时处理,利用增量学习实现新增数据中有效信息与原有模型的增量融合及对分类模型的动态更新调整,完成对设备运行过程中产生的实时状态数据的高效诊断,显着提高模型的诊断准确率,节约时间空间成本,满足工业生产中的实际需求。
二、支持向量机增量学习的算法与应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、支持向量机增量学习的算法与应用(论文提纲范文)
(1)一类支持向量机在线算法及其应用(论文提纲范文)
摘要 |
Abstract |
引言 |
0.1 研究背景 |
0.2 研究进展及现状 |
0.2.1 在线学习算法研究进展及现状 |
0.2.2 支持向量机在线算法研究进展及现状 |
0.3 研究意义 |
0.4 章节安排 |
1 预备知识 |
1.1 优化基础知识 |
1.1.1 凸二次规划问题 |
1.1.2 外点惩罚函数法 |
1.1.3 拉格朗日对偶性 |
1.2 随机规划基础知识 |
1.2.1 邻近梯度法 |
1.2.2 随机邻近梯度法 |
1.3 支持向量机基础知识 |
1.3.1 支持向量机概述 |
1.3.2 线性可分支持向量机 |
1.3.3 线性支持向量机 |
1.3.4 非线性支持向量机 |
2 基于随机邻近梯度法的支持向量机在线算法 |
2.1 支持向量机优化问题转换 |
2.2 将随机邻近梯度法应用于支持向量机优化问题 |
3 基于随机邻近梯度法的Passive-Aggressive在线算法 |
3.1 Passive-Aggressive算法理论 |
3.2 Passive-Aggressive算法优化问题转换 |
3.3 将随机邻近梯度法应用于Passive-Aggressive算法优化问题 |
4 实证分析 |
4.1 数据来源与描述 |
4.2 数据处理与分析 |
4.2.1 异常值处理 |
4.2.2 数据描述性分析 |
4.2.3 标准化与哑变量设置 |
4.3 模型建立、预测与评估 |
4.3.1 模型建立 |
4.3.2 SVM模型结果与评估 |
4.3.3 SPG-SVM模型结果与评估 |
4.3.4 PA模型结果与评估 |
4.3.5 SPG-PA模型结果与评估 |
4.4 对比分析 |
结论 |
参考文献 |
致谢 |
(2)大数据环境下支持向量机的泛化性能(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 支持向量机 |
1.2 增量支持向量机 |
1.3 在线成对支持向量机 |
1.4 本文主要工作 |
1.5 论文的组织结构 |
第2章 主要工具 |
2.1 泛化界的误差分解 |
2.2 马氏链定义及相关结论 |
2.3 几何β-混合序列定义及相关结论 |
2.4 α-混合序列定义及相关结论 |
2.5 指数强混合序列定义及结论 |
2.6 独立同分布样本的结论 |
2.7 本章小结 |
第3章 拉格朗日支持向量机的泛化性能 |
3.1 引言 |
3.2 拉格朗日支持向量机 |
3.3 主要结果 |
3.3.1 基于一致遍历马氏链样本的结果 |
3.3.2 基于指数强混合序列的结果 |
3.3.3 基于独立同分布样本的结果 |
3.4 主要结果的证明 |
3.5 本章小结 |
第4章 支持向量机增量学习算法的泛化性能 |
4.1 引言 |
4.2 主要结果 |
4.2.1 基于独立同分布样本的结果 |
4.2.2 基于一致遍历马氏链样本的结果 |
4.3 主要结果的证明 |
4.4 本章小结 |
第5章 在线成对支持向量机的泛化性能 |
5.1 引言 |
5.2 主要理论结果 |
5.2.1 基于一致遍历马氏链样本的结果 |
5.2.2 基于指数强混合序列的结果 |
5.2.3 基于独立同分布样本的结果 |
5.3 理论结果的证明 |
5.4 基于马氏选择性抽样的在线成对支持向量机算法 |
5.4.1 算法 |
5.4.2 实验结果与分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 本文工作总结 |
6.2 未来的研究方向 |
参考文献 |
致谢 |
博士生在读期间已发表的论文情况 |
(3)面向数据流的类增量学习技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 面向数据流的类增量学习技术的应用背景 |
1.1.2 面向数据流的类增量学习技术的应用需求 |
1.2 面向数据流的类增量学习技术 |
1.2.1 技术概述 |
1.2.2 技术挑战 |
1.3 本文工作 |
1.3.1 基于中心扩散式的样例生成增强算法 |
1.3.2 基于单类支持向量机的层级嵌套算法 |
1.3.3 基于代价敏感支持向量机的中心扩散式数据流类增量学习算法 |
1.4 论文结构 |
第二章 相关研究 |
2.1 类增量学习技术 |
2.1.1 基于集成学习的类增量学习技术 |
2.1.2 基于随机森林的类增量学习技术 |
2.1.3 基于支持向量机的类增量学习技术 |
2.2 类不平衡学习技术 |
2.2.1 基于随机采样的类不平衡学习技术 |
2.2.2 基于代价敏感学习的类不平衡学习技术 |
2.2.3 基于核函数的类不平衡学习技术 |
2.3 本章小结 |
第三章 基于中心扩散式的样例生成增强算法 |
3.1 引言 |
3.2 基本思想 |
3.2.1 预备知识 |
3.2.2 算法流程 |
3.3 基于中心扩散式的样例生成增强算法设计 |
3.3.1 中心扩散式样例生成 |
3.3.2 自适应增强迭代 |
3.4 实验结果与分析 |
3.4.1 实验设置 |
3.4.2 算法性能评估 |
3.4.3 参数敏感性测试 |
3.5 本章小结 |
第四章 基于单类支持向量机的层级嵌套算法 |
4.1 引言 |
4.2 基本思想 |
4.2.1 预备知识 |
4.2.2 算法流程 |
4.3 基于单类支持向量机的层级嵌套算法设计 |
4.3.1 基于OCSVM算法的单分类模型构建 |
4.3.2 自底向上层级嵌套分类模型构建 |
4.4 实验结果与分析 |
4.4.1 实验设置 |
4.4.2 算法性能评估 |
4.4.3 参数敏感性测试 |
4.5 本章小结 |
第五章 基于代价敏感支持向量机的中心扩散式数据流类增量学习算法 |
5.1 引言 |
5.2 基本思想 |
5.2.1 预备知识 |
5.2.2 算法流程 |
5.3 基于代价敏感支持向量机的中心扩散式数据流类增量学习算法设计 |
5.3.1 面向高维度数据流的样例生成算法 |
5.3.2 面向高维度数据流的层级嵌套算法 |
5.3.3 基于代价敏感支持向量机的中心扩散式数据流类增量学习算法 |
5.4 实验结果与分析 |
5.4.1 实验设置 |
5.4.2 算法性能评估 |
5.5 本章小结 |
结束语 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参加的主要科研工作 |
(4)基于半监督支持向量机的电力系统暂态稳定评估(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 课题的研究背景及意义 |
1.2 电力系统暂态稳定评估研究现状 |
1.2.1 传统暂稳评估方法研究现状 |
1.2.2 机器学习法暂稳评估研究现状 |
1.3 本文主要研究内容 |
2 半监督支持向量机暂态稳定评估基础理论 |
2.1 引言 |
2.2 支持向量机算法简介 |
2.2.1 标准支持向量机 |
2.2.2 孪生支持向量机 |
2.3 半监督学习理论 |
2.3.1 基于图的半监督学习 |
2.3.2 直推式半监督学习 |
2.4 机器学习法暂态稳定评估框架 |
2.4.1 样本生成与特征构建 |
2.4.2 关键特征的选择及提取 |
2.4.3 模型构建与参数寻优 |
2.4.4 结果检验及性能评价 |
2.5 本章小结 |
3 基于模糊半监督孪生支持向量机的暂态稳定评估 |
3.1 引言 |
3.2 模糊拉普拉斯孪生支持向量机算法 |
3.2.1 拉普拉斯正则化半监督学习框架 |
3.2.2 模糊隶属度函数的构建 |
3.2.3 模糊拉普拉斯孪生支持向量机 |
3.3 基于FLAP-TWSVM的电力系统暂态稳定评估模型 |
3.3.1 半监督机器学习法暂稳评估问题描述 |
3.3.2 关键输入特征集的构建与缩减 |
3.3.3 基于FLAP-TWSVM的暂态稳定评估流程 |
3.4 算例与结果分析 |
3.4.1 WSCC-9 节点系统 |
3.4.2 IEEE-39 节点系统 |
3.5 本章小结 |
4 基于在线自适应直推式支持向量机的暂态稳定评估 |
4.1 引言 |
4.2 基本研究思路 |
4.3 在线自适应直推式支持向量机学习算法 |
4.3.1 直推式支持向量机的原理 |
4.3.2 在线增量学习与减量学习 |
4.3.3 参数摄动模型自适应优化 |
4.4 基于OATSVM的电力系统暂态稳定实时评估方法 |
4.4.1 输入特征的构建原则及描述 |
4.4.2 在线自适应暂态稳定评估流程 |
4.5 算例与结果分析 |
4.5.1 样本数据集的构造 |
4.5.2 评估精度及时间分析 |
4.6 本章小结 |
5 结论与展望 |
5.1 结论 |
5.2 展望 |
参考文献 |
附录 |
A.作者在攻读硕士学位期间完成的论文 |
B.学位论文数据集 |
致谢 |
(5)基于在线学习支持向量机的中国股票市场价格预测研究(论文提纲范文)
摘要 |
ABSTRACT |
第—章 引言 |
1.1 研究背景及意义 |
1.2 研究方法、内容和技术路线 |
1.2.1 研究方法 |
1.2.2 研究内容及技术路线 |
1.3 本文主要创新点 |
第二章 相关文献综述 |
2.1 支持向量机应用于金融市场文献综述 |
2.2 在线学习支持向量机文献综述 |
2.2.1 在线学习最小二乘支持向量机 |
2.2.2 在线学习核感知机支持向量机 |
2.2.3 增量/减量在线学习支持向量机 |
第三章 在线学习和支持向量机理论 |
3.1 在线学习简介 |
3.2 统计学理论 |
3.2.1 VC维理论 |
3.2.2 推广性的界 |
3.2.3 结构风险最小化 |
3.3 支持向量机理论 |
3.3.1 分类支持向量机 |
3.3.2 回归支持向量机 |
3.4 核函数 |
3.4.1 核函数简介及特点 |
3.4.2 核函数原理 |
3.4.3 常用核函数 |
3.5 网格交叉核函数参数优化算法 |
3.6 本章总结 |
第四章 最小二乘支持向量机在线学习算法 |
4.1 代表性支持向量机在线学习算法 |
4.1.1 基于KKT条件的在线学习策略 |
4.1.2 基于时间窗口的在线学习策略 |
4.2 基于最小二乘支持向量机的增量式在线学习算法的推导 |
4.2.1 最小二乘支持向量机 |
4.2.2 在线学习算法 |
4.3 本章总结 |
第五章 股票短期价格预测模型建立和实证分析 |
5.1 具体流程 |
5.2 数据选则和处理 |
5.2.1 数据选取 |
5.2.2 数据处理 |
5.3 核函数及参数确定 |
5.3.1 核函数归纳 |
5.3.2 模型评价方法 |
5.3.3 招商银行最小二乘SVM核函数参数选择 |
5.3.4 招商银行在线学习LSSVM核函数参数选择 |
5.3.5 拟合及预测结果比较分析 |
5.4 基于径向基核函数的在线学习LSSVM股价预测 |
5.5 本章总结 |
第六章 总结与展望 |
参考文献 |
致谢 |
(6)基于SVM文本分类的传销识别研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 特征加权算法的研究现状 |
1.2.2 文本表示模型的研究现状 |
1.2.3 支持向量机的增量学习 |
1.3 本文主要研究内容与贡献 |
1.4 本文的组织结构 |
第2章 文本分类基础 |
2.1 文本分类问题 |
2.2 文本预处理 |
2.3 特征选择算法 |
2.3.1 互信息 |
2.3.2 卡方统计 |
2.3.3 文档频率 |
2.4 分类器 |
2.4.1 朴素贝叶斯 |
2.4.2 支持向量机 |
2.4.3 K近邻 |
2.4.4 决策树 |
2.5 性能评估 |
2.6 本章小结 |
第3章 加权算法的改进 |
3.1 现有的特征加权算法 |
3.1.1 词频 |
3.1.2 TF-IDF |
3.1.3 TF-CRF |
3.2 对特征加权算法的改进 |
3.2.1 类间文档频率比 |
3.2.2 类间特征频率比 |
3.2.3 TF-CTDF算法 |
3.3 实验和结果分析 |
3.3.1 实验环境 |
3.3.2 数据集介绍 |
3.3.3 实验介绍 |
3.3.4 实验结果分析 |
3.4 本章小结 |
第4章 向量空间模型的改进 |
4.1 文本表示模型 |
4.2 结合主题的文本表示模型 |
4.2.1 现状描述与改进思路 |
4.2.2 改进模型 |
4.3 传销文本分析 |
4.3.1 传销文本特征 |
4.3.2 传销的奖励机制 |
4.4 结合传销特点改进向量空间模型 |
4.4.1 传销主题向量空间模型 |
4.5 Word2Vec用于词典构建 |
4.5.1 Word2Vec |
4.5.2 词典构建流程描述 |
4.6 实验与结果分析 |
4.6.1 数据集介绍 |
4.6.2 实验介绍 |
4.6.3 实验结果分析 |
4.7 本章小结 |
第5章 SVM的增量学习 |
5.1 增量学习算法 |
5.2 支持向量机 |
5.2.1 KKT条件 |
5.3 支持向量机的增量学习算法 |
5.3.1 Simple-ISVM |
5.3.2 RS-ISVM |
5.3.3 CSV-ISVM |
5.4 增量学习在传销文本识别中的应用 |
5.5 本章小结 |
总结 |
本文总结 |
工作展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
(7)基于数据驱动的危化品事故分析预警关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
创新点摘要 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 数据驱动技术在危化品行业应用现状 |
1.2.2 危化品事故分析方法研究现状 |
1.2.3 危化品平台研究应用现状 |
1.3 本文研究内容及技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 论文篇章结构 |
第二章 基于物联感知的异常行为识别与危化品数据采集 |
2.1 基于混合特征水平集的异常行为监测与识别方法 |
2.1.1 图像特征提取 |
2.1.2 基于水平集LBF模型的异常监测 |
2.1.3 算法实验结果 |
2.2 基于物联网关的危化品数据采集 |
2.2.1 危化品信息采集物联网关总体方案设计 |
2.2.2 危化品信息采集物联网关硬件设计 |
2.2.3 危化品信息采集物联网关软件设计 |
2.2.4 危化品信息采集物联网关实现 |
2.3 危化品信息采集物联网关应用 |
2.4 本章小结 |
第三章 基于知识图谱的危化品事故状态向量构建 |
3.1 危化品事故状态向量 |
3.1.1 危化品事故状态向量定义 |
3.1.2 事故状态向量的意义 |
3.2 面向危化品事故知识图谱构建 |
3.2.1 知识图谱整体框架 |
3.2.2 知识图谱构建关键技术 |
3.2.3 化学品知识图谱构建 |
3.2.4 危险化学品知识图谱高效储存与数据校验更新 |
3.3 基于知识图谱的危化品事故状态向量构建 |
3.3.1 基于知识图谱的危险化学品领域搜索与推理 |
3.3.2 危化品事故状态向量构建 |
3.4 本章小结 |
第四章 基于事故状态向量的分析预警模型构建与可视化 |
4.1 基于事故状态向量的SVM事故预测分析 |
4.1.1 支持向量机增量算法 |
4.1.2 基于状态向量距离的SVM增量学习改进 |
4.1.3 模型建立和实验验证 |
4.2 基于时态GIS的事故预警云图可视化 |
4.2.1 算法研究背景及问题分析 |
4.2.2 基于核密度法的危化品事故区域预警分布云图可视化 |
4.2.3 可视化实验结果 |
4.3 本章小结 |
第五章 危化品事故预警与防控平台建设及应用 |
5.1 系统架构集成技术 |
5.1.1 技术架构设计 |
5.1.2 系统功能设计 |
5.2 重大危险源在线监控及事故预警系统 |
5.2.1 系统背景 |
5.2.2 系统功能 |
5.2.3 系统结果展示 |
5.3 高危行业(危险化学品)事故预警与防控平台建设 |
5.3.1 系统背景 |
5.3.2 系统功能 |
5.3.3 系统结果展示 |
5.3.4 系统应用效果 |
5.4 本章小结 |
总结与展望 |
本文总结 |
参考文献 |
攻读学位期间获得的成果 |
致谢 |
作者简介 |
(8)分解算法应用和分位数回归(论文提纲范文)
摘要 |
ABSTRACT |
1 引言 |
1.1 理论基础 |
1.2 分解算法 |
1.3 最小二乘支持向量机 |
1.4 在线学习算法 |
1.5 小结 |
2 支持向量机模型 |
2.1 核函数 |
2.2 常用核函数 |
2.3 分类与回归问题 |
2.4 平分最近点模型 |
2.5 最大间隔模型 |
2.6 小结 |
3 分解算法 |
3.1 选块算法 |
3.2 SVM~(Light)算法 |
3.3 SMO改进算法 |
3.3.1 变量 α1, α2的精确求解 |
3.3.2 变量 α1, α2的选择 |
3.4 ELSVM算法 |
3.5 算法实验与结果分析 |
4 剪枝算法 |
4.1 基于SMO的剪枝算法 |
4.2 基于增量学习和减量学习的剪枝算法 |
4.2.1 块增量学习 |
4.2.2 减量学习 |
4.2.3 剪枝策略 |
4.2.4 停机准则 |
4.3 小结 |
5 分位数学习 |
5.1 不同分布下的样本 |
5.2 分位数回归 |
5.3 在线分位数回归算法 |
5.4 非一致分布下在线分位数回归的误差 |
5.4.1 抽样误差的估计 |
5.4.2 定理 5.4.1 的证明 |
参考文献 |
致谢 |
(9)基于集成增量动态权重组合的设备故障分类方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 设备故障诊断的研究现状 |
1.2.2 非平衡性数据处理的研究现状 |
1.2.3 增量学习的研究现状 |
1.2.4 选择性集成的研究现状 |
1.3 本文工作和贡献 |
1.3.1 研究内容 |
1.3.2 创新点 |
1.4 本文结构安排 |
第二章 理论基础 |
2.1 非平衡数据处理方法 |
2.1.1 过采样技术 |
2.1.2 欠采样技术 |
2.1.3 代价敏感思想 |
2.2 增量学习 |
2.3 选择性集成 |
2.4 支持向量机 |
2.5 神经网络 |
2.5.1 循环神经网络 |
2.5.2 长短期记忆神经网络 |
2.6 本章小结 |
第三章 基于LSTM-SVM的动态权重组合分类模型 |
3.1 特征提取模型 |
3.1.1 小波包去噪和重构 |
3.1.2 极点对称模态分解 |
3.1.3 具体实现 |
3.2 LSTM-SVM动态权重组合分类模型构建 |
3.2.1 组合分类器权重调整方法 |
3.2.2 SVM模型构建 |
3.2.3 LSTM模型构建 |
3.3 基于LSTM-SVM的动态权重组合分类模型 |
3.4 本章小结 |
第四章 基于集成增量动态权重组合的设备故障诊断分类模型 |
4.1 非平衡数据处理 |
4.2 基于learn++的选择性集成增量模型 |
4.3 基于集成增量动态权重组合的设备故障诊断分类模型 |
4.4 本章小结 |
第五章 轴承故障诊断实验结果及分析 |
5.1 实验数据分析 |
5.2 模型结构分析 |
5.2.1 DWCLS模型 |
5.2.2 DWCMI模型 |
5.3 结果分析 |
5.3.1 特征提取 |
5.3.2 DWCLS模型性能分析 |
5.3.3 DWCMI模型性能分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间所取得的相关科研成果 |
致谢 |
(10)基于增量集成学习的设备故障诊断方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 设备故障诊断的研究现状 |
1.2.2 增量学习的研究现状 |
1.2.3 非平衡数据处理的研究现状 |
1.3 本文工作和贡献 |
1.3.1 研究内容 |
1.3.2 创新点 |
1.4 本文结构安排 |
第二章 相关理论基础 |
2.1 增量学习 |
2.2 非平衡数据处理 |
2.2.1 K近邻 |
2.2.2 合成少数类过采样技术和欠采样技术 |
2.3 堆叠式降噪自动编码器 |
2.4 机器学习 |
2.4.1 支持向量机 |
2.4.2 集成学习 |
2.5 本章小结 |
第三章 增量驱动集成学习算法 |
3.1 非平衡数据处理 |
3.1.1 基于样本权重的少数类样本过采样 |
3.1.2 基于样本权重的多数类样本欠采样 |
3.1.3 基于样本分布的重采样 |
3.1.4 增量数据非平衡处理 |
3.2 特征模式提取 |
3.3 特征模式分类 |
3.3.1 基于集成支持向量机的特征模式分类 |
3.3.2 集成学习基分类器构建 |
3.3.3 集成模型增量调整 |
3.4 增量驱动集成学习算法实现流程 |
3.5 本章小结 |
第四章 基于增量信息的动态权重集成学习模型 |
4.1 基分类器动态评价机制 |
4.2 有效信息增益选择 |
4.3 基于增量信息的动态权重集成学习模型具体实现 |
4.4 本章小结 |
第五章 实验研究及分析 |
5.1 数据描述 |
5.2 模型参数与结构 |
5.3 结果分析 |
5.3.1 IDE模型性能分析 |
5.3.2 DWE模型性能分析 |
5.3.3 IDE模型与DWE方法性能比较 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间所取得的相关科研成果 |
致谢 |
四、支持向量机增量学习的算法与应用(论文参考文献)
- [1]一类支持向量机在线算法及其应用[D]. 周林寰. 大连理工大学, 2021(02)
- [2]大数据环境下支持向量机的泛化性能[D]. 曾京京. 湖北大学, 2021(01)
- [3]面向数据流的类增量学习技术研究[D]. 刘铭宇. 国防科技大学, 2020(02)
- [4]基于半监督支持向量机的电力系统暂态稳定评估[D]. 陈鑫磊. 重庆大学, 2019(01)
- [5]基于在线学习支持向量机的中国股票市场价格预测研究[D]. 夏爽. 南京大学, 2019(05)
- [6]基于SVM文本分类的传销识别研究[D]. 宿绍勋. 北京工业大学, 2019(03)
- [7]基于数据驱动的危化品事故分析预警关键技术研究[D]. 刘康炜. 中国石油大学(华东), 2019(01)
- [8]分解算法应用和分位数回归[D]. 杨鹏伟. 武汉大学, 2019(06)
- [9]基于集成增量动态权重组合的设备故障分类方法研究[D]. 王志杰. 河北工业大学, 2019
- [10]基于增量集成学习的设备故障诊断方法研究[D]. 曹雪. 河北工业大学, 2019