一、聚类抽样情形下基于广义线性模型的风险比估计(论文文献综述)
高天雄[1](2021)在《基于广义估计方程的多元失效时间数据的相关性研究》文中研究指明相依失效时间数据常用于各类生物医学研究中,其中失效时间的相关性估计是分析相依生存数据的一个重要问题。广义估计方程是半参数边际Cox模型的参数估计问题中得到广泛应用的方法。本文对现有的广义估计方程的中间变量和工作相关阵进行了研究,通过矩方法证明了中间变量的相关系数为无穷小量,这一结论导致工作相关阵不能正确反映中间变量的相关性。本文也提出了一种改进的广义估计方程方法,并对失效时间数据的相关性估计做出了讨论。模拟实验证明,在边际Cox模型回归分析问题中,改进的广义估计方程相比原来的方法,能够减少迭代次数,并能一定程度上反映中间变量的相关性信息。最后我们将改进的广义估计方程方法应用于肾感染的失效时间分析中。
王闯世[2](2019)在《脆弱模型在层次生存数据中的比较及在睡眠与死亡或心血管事件关联中的应用研究》文中提出背景与目的层次结构数据或多水平数据在医学研究中非常常见,如使用多阶段整群抽样设计的大规模流行病学研究,或采用群组随机试验设计的干预比较研究,其最重要的特点之一是“层内”数据间的相关性。多水平模型或分层模型常用来处理这类数据,目前关于连续型或离散型多水平数据分析方法(如广义线性多水平模型)的研究较多;而关于层次生存数据分析方法的研究相对较少。脆弱模型是最常见的一种层次生存模型,能够处理不同类型的层次生存数据,如集群数据(clustered data)和复发事件(recurrent events),其中最常用的是Cox共享脆弱模型,为半参数模型。与参数脆弱模型相比,半参数脆弱模型无需指定基准风险函数,可能会损失部分数据信息,是否会因此损耗效应估计和假设检验的能力尚不清楚。论文第一部分借助蒙特卡罗模拟技术开展比较研究,探索在不同情境下(样本量、群组样本量、删失比例、群组内相关性程度),Cox和参数共享脆弱模型的效应估计和假设检验能力,及不同因素对它们表现的影响。论文第二部分基于大规模前瞻性流行病学研究的随访数据,使用脆弱模型开展实例研究。人们平均每天花费约三分之一的时间睡觉,睡眠对人类健康至关重要,它越来越被认为是影响心血管疾病(Cardiovascular Diseases,CVDs)和死亡的一种重要的生活方式。既往关于睡眠与心血管疾病的人群流行病学研究局限在一些国家或地区,且结果存在争议,本实例研究基于来自21个高、中和低收入国家的人群队列探索睡眠(24小时睡眠时长、白天小睡)与死亡或主要心血管事件的关联性。方法对于模型的比较研究,借助蒙特卡罗模拟,生成满足不同情境设定的二水平生存数据,比较各情境下Cox共享脆弱模型和参数共享脆弱模型的效应估计和假设检验表现。情境设定因素包括总样本量N(200,500),群组样本量k(50,25,10),删失比例 c(10%,30%,50%)和群组内相关性 Kendall’s τ(0.2,0.5,0.6),每个情境均开展1000次模拟。模型比较评价指标包括:固定效应回归系数估计均数和标准误、平均相对百分偏差(bias%)和均方误差(Mean Squared Error,MSE)[效应估计准确性指标]、脆弱分布参数估计均数、经验覆盖率、统计检验效能或Ⅰ类错误[假设检验能力指标]。对于睡眠与主要心血管事件或死亡的关联性研究,数据来源于前瞻性城乡流行病学研究(Prospective Urban Rural Epidemiological study,PURE),该研究采用多阶段整群抽样方法,招募来自全球21个高、中和低收入国家的35-70岁成年人,基线招募及数据采集从2003年开始,基线数据采集及随访事件确认均采用标准的问卷或病例报告表。该研究一共纳入116,632名调查对象,截至2017年9月,该队列的中位随访时间是7.8年(四分位数间距:5.1-9.2年)。夜间睡眠时间以就寝时间和醒来时间之间的间隔来估计,白天小睡时间以调查对象自报的时间估算,24小时总睡眠时间以两者之和估算。结局指标均为时间-事件,主要结局事件为死亡和非致命性心肌梗死、卒中和心力衰竭的复合事件。使用Cox共享脆弱模型评估24小时估计睡眠时间、白天小睡与结局指标的关联性,并探索不同睡眠习惯地区关联性是否一致。此外,还进行了一系列敏感性分析进一步了解关联结果的稳定性。结果模拟研究结果显示,在风险比(Hazard Ratio,HR)≠1的场景中,Cox共享脆弱模型(以下简称“Cox模型”)和Weibull共享脆弱模型(以下简称“Weibull模型”)固定效应估计值的平均相对百分偏差均在5%以内,MSE均不超过0.05,与真值非常接近;两个模型bias%差异不超过1.5%,MSE差异低于0.01,准确性相当;N=200时,Weibull模型统计检验效能比Cox模型高2%左右,当N增大到500时,两个模型统计功效差值在0.5%以内;整体来看,Cox模型脆弱分布参数θ估计均值更接近真值。两个模型效应估计准确性和统计检验效能随群组规模增大、删失比例降低而提高,θ估计准确性随之降低,但幅度均较小;群组内相关性对参数估计影响较小,但可能削弱模型检验效能。在HR=1的场景中,Cox模型和Weibull模型固定效应估计值的MSE均低于0.05,两个模型MSE差异非常小,不超过0.001,准确性非常接近;大部分模拟情境中,Cox模型脆弱分布参数θ估计均值大于Weibull模型,更接近真值;两个模型Ⅰ类错误发生概率基本在可接受范围(~0.05),但在个别情境下低于0.045,相同设定下两个模型差异不超过0.005。群组规模增大、删失比例降低能够提高两个模型固定效应估计准确性,群组内相关性对模型参数估计的影响较小。实例研究结果显示,截至2017年9月,共有4381例死亡和4365例主要心血管事件发生。以每天睡6-8小时作为参照,调整人口学信息、生活方式和疾病史后,每天睡眠时间大于8小时与复合事件风险增加有关,且随着睡眠时间增加,事件发生风险也呈递增趋势(HR:8-9h:1.05[0.99-1.12];9-10h:1.17[1.09-1.25];>10h:1.41[1.30-1.53],趋势检验P值<0.0001);每天睡眠不超过6小时的人复合事件发生风险也增加,但没有达到统计学显着性(HR:1.09[0.99-1.20])。不同睡眠习惯地区(白天小睡是否常见)24小时估计睡眠时间与事件关联性均呈J型,24小时睡眠时长与两个次要终点结局(死亡、主要心血管事件)也呈J型关联,敏感性分析结果稳定。此外,当夜间得到充足或更长的睡眠时(每晚>6h),与白天不小睡的人比,白天小睡的人死亡或主要心血管事件的发生风险增加,且随着小睡时间延长,风险增加(HR:0-1h:1.13[1.07-1.20];>1h:1.31[1.21-1.43]);但当夜间睡眠缺乏时(每晚≤6h),没有观察到白天小睡的人事件发生风险增加。结论半参数Cox共享脆弱模型处理层次生存数据的表现不劣于参数共享脆弱模型,并不损失效应估计的准确性和假设检验能力;在大样本研究中,Cox共享脆弱模型是分析层次生存数据很好的选择。24小时估计睡眠时间与死亡或主要心血管事件间呈J型关联,每天睡约6-8小时的成年人发生死亡或主要心血管事件的风险最低;对于夜间睡眠超过6小时的成年人,与无白天小睡相比,白天小睡与死亡或主要心血管事件风险增加相关,而夜间睡眠≤6小时但白天小睡的成年人未观察到事件发生风险增高。
张珠香[3](2018)在《电子商务客户流失的生存分析模型及挽救策略研究》文中进行了进一步梳理面对居高不下的电子商务客户流失率,如何有效降低客户的流失意愿对电子商务企业来说意义重大。虽然投放大量广告或不断优化产品是简单易行的保留措施,但这种毫无针对性的客户保留会使企业面临浪费资源的风险,甚至会导致客户不满意而加速客户流失。大数据时代的到来使得客户数据更易被记录搜集,利用数据建立模型分析客户的流失行为,对潜在流失客户采取科学的挽留策略,为电子商务企业更有效率地理解客户消费行为与应对市场需求变化提供了新的路径。本文针对电子商务客户流失事件的随机特征,基于2037个真实客户数据,建立电子商务客户流失的生存分析模型。本文还对客户挽留过程中所涉及到的是否挽救、挽救次序、挽救成本、挽救比例等决策问题建立数学模型求解,并结合样本数据验证模型的可操作性和有效性,帮助企业避免犯“挽留一个不该挽留的人”、“未挽留一个该挽留的人”两种错误。通过研究,本文得到以下结论:(1)生存分析方法能够有效处理本文样本数据的删失性,简单删除删失数据或直接将删失数据当成完全数据都是不恰当的处理方式,均会低估电子商务客户的生存率。不同消费特征下客户生存时间的分布差异是显着的,具有经常购买、关注微店、在省内、参与过优惠活动、有过订单留言、有过退货维权等消费特征的客户,拥有更高的生存率或更长的生存时间。(2)本文所构建的三个Cox模型对影响客户流失风险的“危险因素”和“保护因素”的判断完全一致。客户购买次数、客户属地、订单留言、退货维权、消费金额波动对客户流失风险具有良好的预后效果,而关注微店、参与优惠活动对延长客户生存时间有利,能减少客户流失的风险,充分说明引导客户关注微店和对客户优惠让利仍是电子商务企业的有效营销手段。特别地,平均购买间隔对客户流失风险的影响效应不是固定的常数,会随着时间的变化而变化,其变化形式为β9(t)=-0.21+0.03log(t)。(3)企业开展流失管理的最终目的是实现挽留利润最大化,客户个体给企业带来的挽救利润是异质的,每个个体的挽救利润与流失概率、客户价值、客户接受挽救的可能性、挽救成本密切相关,企业整体的挽救利润还与挽救比例相关。与传统根据客户流失概率确定挽救次序相比,本文以挽留利润增量作为挽救次序的排序指标,可以在不增加成本的情况下,为企业带来更多的挽救收益,从而验证本文所提出的挽救模型是有效的。
陈梦锴[4](2017)在《随访研究中两个问题的探讨》文中认为背景与目的:临床随访研究中以生存时间作为主要疗效指标较为常见,而数据删失是生存资料的重要特征之一。有研究表明,过高的删失率将导致疗效估计偏差,检验效能降低。实际研究中,往往组间的删失率水平不同,有时还相差较大,这种情况下对疗效评价产生何种影响尚无定论。此外,很多临床试验中观察的事件(例如肿瘤研究中发生进展)只有在访视时才能发现,因此,并不知道准确的事件发生时间,即区间删失。本文主要探讨临床试验中这两个问题:(1)组间不同删失率情况下常规疗效评价方法的统计学性质,(2)区间删失时,生存时间的不同定义方法对参数估计结果的影响。方法:采用Monte-Carlo模拟方法,基于指数分布和Weibull分布分别产生生存时间,在不同情况下,分别采用log-rank检验及Cox比例风险回归模型进行相应的参数估计和组间疗效的比较。论文分为两个部分,第一部分:在组间删失率相同和不同时,从假设检验的一类错误和检验效能、参数估计的准确度估计偏差等三个方面来评价对疗效评价的影响;第二部分:区间删失时,事件发生时间不确定,比较3种不同的生存时间的定义方法,对中位生存时间和风险比估计的影响。结果:1)在生存分析中,删失率的变化,会导致第一类错误率变化,且随删失率的增大,检验效能逐渐下降;2)相比于两组删失率相等的情况,两组删失率不等时,一类错误增加,HR的偏倚增大;且两组删失率相差越大,第一类错误率越大,检验的结果越不可信。3)区间删失时,生存时间的不同定义对中位生存时间有影响,在随访间隔不是很大时,对中位生存时间之差以及HR的估计影响不大。4)采用Cox比例风险回归模型进行疗效评价时,所得结果与log-rank检验相似。结论:1)临床随访研究中,总删失率应控制在30%以内,组间删失率之差应控制在10%以内,否则将导致一类错误膨胀。2)区间删失时,事件发生时间不确定,应尽可能缩短每次访视的时间,无论采用何种生存时间定义,不宜估计各组的中位生存时间,但估计中位生存时间之差或HR是可行的。
沈政[5](2017)在《新农合对劳动供给、贫困缓解的影响研究》文中指出为减轻农民医疗经济负担、改善农民健康状况,中国政府从2003年开始实施新型农村合作医疗制度(以下简称"新农合")。自实施以来,新农合发展十分迅速,参合人数和比例均有较大幅度的增加,医疗补偿水平和补偿受益人次也在不断提高,这在一定程度上促进了参合农民对医疗资源服务的利用,农民健康水平也因此得到较大提升,初步实现了新农合政策的基本目标。然而,随着二元经济结构的刘易斯转折点到来,农村劳动力开始面临结构性短缺、农村劳动力老龄化趋势进一步加剧,农村人口健康风险加大、患病人群比例特别是慢性病患者比例明显增加。与此同时,面对着长期居高不下的医疗费用,农村居民的医疗经济负担仍然较重,农民"因病致贫、因病返贫"问题比较突出。那么,作为一项社会性的医疗保障制度,新农合到底能否显着改善农村居民的劳动力供给状况?参合农民的"因病致贫、因病返贫"问题是否得到有效缓解?农村贫困家庭的慢性病与劳动力供给状况如何?而患病成员对其配偶家务劳动和市场工作时间的安排与决策又会产生什么样的影响?这些问题不仅关系到新农合制度的完善与发展,也涉及到农村劳动力市场建设、健康扶贫推进以及未来长期农业经济发展,因此需要进行深入研究。本研究依据健康需求理论、劳动供给理论、福利经济学理论以及贫困理论等相关经济学理论,利用中国健康与营养调查数据(CHNS)对以下内容进行了实证分析:(1)采用倍差法回归模型估计新农合对农业劳动时间、非农劳动参与、劳动力退出以及因病不能工作时间的影响效应,并进一步分析新农合对以上劳动供给结果的影响是否因性别、年龄、健康状况以及收入而存在差异;(2)基于生存分析方法的研究框架,采用Kaplan-Meier生存函数对农户因病致贫风险的变化趋势及分布特征进行描述,然后利用离散型时间cloglog风险模型估计新农合对农户因病致贫的缓解作用,并考察该缓解作用是否因农村交通状况较差、医疗服务资源供给不足而受到限制;(3)针对农村贫困家庭,采用联立方程组模型估计本人或配偶高血压病对个人农业劳动供给时间和非农劳动参与的影响,并对配偶高血压病影响个人农业劳动时间的家务劳动中介效应进行了检验,另外还考察了高血压病贫困患者的医疗服务利用情况。本文的主要研究结论包括:第一,新农合的实施显着增加了农民的农业劳动供给时间和非农劳动参与概率;与非参合者相比,参合者退出劳动力市场的概率和因病不能工作的时间要明显更低。第二,新农合对农村劳动供给的影响因不同群体特征存在一定差异。在性别和年龄方面,新农合显着增加了男性农业劳动供给时间,并对50岁及以上的农村中老年人农业劳动供给的有显着正向影响作用;对于健康状况较差者,参合农民的非农劳动参与概率增加了 8.1%,而农业劳动供给时间也有一定增加;从收入分组估计结果看,新农合对低收入家庭的农业劳动供给时间和非农劳动参与概率均有显着的正向影响作用,并且显着减小了低收入者因病不能工作的时间。第三,新农合显着降低了农户因病致贫的风险概率,在防止农户因病致贫方面起到重要作用;然而,农村交通状况不佳、医疗服务供给不足会限制新农合对因病致贫的缓解作用。第四,农村贫困家庭女性的农业劳动供给会因配偶患有高血压病而显着减少。其中,在配偶高血压病的影响下,家务劳动对已婚女性农业劳动具有明显替代效应。换言之,配偶高血压病通过增加女性家务劳动时间,显着降低了她们的农业劳动供给。这说明,配偶的慢性病问题会增加农村女性群体的家庭照料负担,进而对妇女的农业劳动供给产生了抑制作用。第五,参加新农合的高血压病贫困患者在接受健康体检、服用降压药、门诊看病以及住院治疗等医疗服务利用方面的使用比例均高于非参合户的贫困患者,新农合的实施对高血压病贫困患者的医疗服务利用有一定改善。然而,参合户贫困患者的医疗服务利用水平总体不高,特别是参加健康体检比例和住院治疗比例仍然很低。根据本文研究结论,提出如下政策建议:加强新农合对农村老年人和低收入者的保障力度;改善农村交通环境,增加农村的医疗服务资源;建立起以家庭为基础的农村高血压病管理模式,加强新农合对高血压病的保障;加强新农合对健康体检等预防性医疗服务的保障。
钱政超,张晨阳,孟令宾,田茂再[6](2014)在《二项抽样下基于鞍点逼近方法的流行病相对风险置信区间构造》文中提出相对风险是流行病学研究中的重要指标之一,它是度量一种暴露因素是否与某病的致病有联系的统计指标.以该指标的数值大小来表明这一暴露因素对某病的发生具有何种影响及影响的大小,体现了暴露与疾病的关联程度.精确地得到相对风险指标的区间估计,对病因推断具有重要意义.但是由于相对风险指标的估计量是两个概率值的估计量的比值,要得到其精确分布一般而言是很困难的,因此已有研究成果大都采用渐近方法估计相对风险的置信区间,这在小样本情况下表现不佳.在二项抽样条件下,对相对风险的点估计、置信区间估计一直被人们所关注.在二项采样下利用鞍点逼近的方法构造相对风险的置信区间,并通过实例与蒙特卡洛模拟,与传统的置信区间构造方法对比,模拟结果显示其优点,尤其是在小样本量条件下估计效果比较好.
邓伟奇,张忠占[7](2004)在《聚类抽样情形下基于广义线性模型的风险比估计》文中研究表明Liu等人在聚类抽样的情形下基于贝塔二项分布模型讨论了风险比的区间估计问题.本文以他们的研究为背景,建立了一类聚类抽样样本的广义线性模型,并采用拟似然方法导出相应的广义估计方程,从而获得风险比的直接估计.这种方法不需要假定分布的具体形式,因而比Liu等人的方法具有更好的适用性.最后在一定正则条件下证明了估计的相合性和渐近正态性质.
二、聚类抽样情形下基于广义线性模型的风险比估计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、聚类抽样情形下基于广义线性模型的风险比估计(论文提纲范文)
(1)基于广义估计方程的多元失效时间数据的相关性研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
2 边际模型与广义估计方程的不同形式 |
2.1 边际模型和参数估计 |
2.2 泊松似然方法和广义估计方程 |
2.3 中间变量的改进和产生的问题 |
3 改进的广义估计方程方法研究 |
3.1 相关性的研究和相关系数矩阵的处理 |
3.2 对广义估计方程的改进 |
3.3 相关性估计的讨论 |
4 模拟实验 |
4.1 关于中间变量的两种相关系数的结论模拟 |
4.2 改进的广义估计方程 |
4.3 相关性估计方法 |
5 实例分析 |
6 结论 |
参考文献 |
附录 A 中间变量K_(ij)的矩和相关系数 |
致谢 |
(2)脆弱模型在层次生存数据中的比较及在睡眠与死亡或心血管事件关联中的应用研究(论文提纲范文)
中英文缩略词 |
中文摘要 |
Abstract |
第一部分 研究背景与现状 |
1.1 层次生存数据 |
1.1.1 生存数据及其特点 |
1.1.2 分层结构数据及其特点 |
1.1.3 层次生存数据及其特点 |
1.2 层次生存数据的统计分析模型 |
1.2.1 一般生存数据统计分析方法 |
1.2.2 广义线性多水平模型 |
1.2.3 层次生存数据的统计模型 |
1.2.3.1 条件风险模型 |
1.2.3.2 边际风险模型 |
1.2.3.3 加速失效时间模型 |
1.2.3.4 离散时间生存模型 |
1.3 传统统计模型处理层次结构数据的局限性 |
1.4 层次生存模型的既往比较研究 |
第二部分 研究目的与意义 |
2.1 研究目的 |
2.2 研究意义 |
2.3 创新点 |
第三部分 研究内容与方法 |
3.1 模拟比较研究 |
3.1.1 层次生存数据的模拟 |
3.1.2 随机模拟情境设定 |
3.1.3 模拟研究的评价指标 |
3.1.4 随机模拟的软件实现 |
3.2 实例研究:睡眠与心血管事件或死亡的关联性研究 |
3.2.1 PURE研究目的 |
3.2.2 PURE研究设计与研究人群 |
3.2.3 PURE研究样本的代表性 |
3.2.4 基线数据收集和随访事件确认 |
3.2.5 结局指标定义 |
3.2.6 统计分析方法 |
3.2.6.1 使用Cox共享脆弱模型探索睡眠与心血管事件或死亡的关联性 |
3.2.6.2 敏感性分析 |
3.2.6.3 使用传统Cox比例风险模型分析关联性 |
第四部分 研究结果 |
4.1 随机模拟研究结果 |
4.1.1 效应真值HR≠1的随机模拟结果及比较 |
4.1.1.1 小样本量下不同群组样本规模的比较:情境T_N1_S1_C1-C3 |
4.1.1.2 小样本量下不同删失比例的比较:情境T_N1_S2_C1-C3 |
4.1.1.3 小样本量下不同群组内相关性的比较:情境T_N1_S3_C1-C3 |
4.1.1.4 大样本量下不同群组样本规模的比较:情境T_N2_S1_C1-C3 |
4.1.1.5 大样本量下不同删失比例的比较:情境T_N2_S2_C1-C3 |
4.1.1.6 大样本量下不同群组内相关性的比较:情境T_N2_S3_C1-C3 |
4.1.1.7 效应真值HR≠1的模拟结果小结 |
4.1.2 效应真值HR=1的随机模拟结果及比较 |
4.1.2.1 小样本量下不同群组样本规模的比较:情境F_N1_S1_C1-C3 |
4.1.2.2 小样本量下不同删失比例的比较:情境F_N1_S2_C1-C3 |
4.1.2.3 小样本量下不同群组内相关性的比较:情境F_N1_S3_C1-C3 |
4.1.2.4 大样本量下不同群组样本规模的比较:情境F_N2_S1_C1-C3 |
4.1.2.5 大样本量下不同删失比例的比较:情境F_N2_S2_C1-C3 |
4.1.2.6 大样本量下不同群组样本规模的比较:情境F_N2_S3_C1-C3 |
4.1.2.7 效应真值HR=1的模拟结果小结 |
4.1.3 随机模拟研究结果小结 |
4.2 实例研究:睡眠与心血管事件或死亡的关联性研究 |
4.2.1 描述性分析 |
4.2.1.1 研究队列的基本情况 |
4.2.1.2 研究人群一般特征 |
4.2.1.3 不同地区研究人群睡眠概况 |
4.2.2 睡眠与心血管事件或死亡的关联性分析 |
4.2.2.1 24小时估计睡眠时间的分组 |
4.2.2.2 24小时估计睡眠时间和结局事件的关联性 |
4.2.2.2.1 按年龄分层分析24小时估计睡眠时间和结局事件的关联性 |
4.2.2.2.2 按地区分层分析24小时估计睡眠时间和结局事件的关联性 |
4.2.2.2.3 按就业状况分层分析24小时估计睡眠时间和结局事件的关联性 |
4.2.2.3 白天小睡和结局事件的关联性 |
4.2.2.3.1 按就业状况分层分析白天小睡和结局事件的关联性 |
4.2.2.3.2 按夜间睡眠时间分层分析白天小睡和结局事件的关联性 |
4.2.2.4 睡眠模式与死亡或主要心血管事件的关联性 |
4.2.2.5 敏感性分析 |
4.2.2.5.1 Fine-Gray模型竞争风险分析 |
4.2.2.5.2 调整分析人群集 |
4.2.2.5.3 进一步调整可能的混杂因素 |
4.2.2.5.4 24小时估计睡眠时间和其他结局事件的关联性 |
4.2.2.6 使用传统Cox模型分析关联性 |
第五部分 研究讨论 |
5.1 随机模拟研究 |
5.1.1 主要发现 |
5.1.2 优势与局限性 |
5.2 睡眠与心血管事件或死亡的关联性研究 |
5.2.1 主要发现 |
5.2.2 优势与局限性 |
第六部分 研究总结与展望 |
6.1 结论 |
6.2 未来的研究 |
参考文献 |
附录 |
个人简历 |
致谢 |
(3)电子商务客户流失的生存分析模型及挽救策略研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究内容与思路 |
1.2.1 主要研究内容 |
1.2.2 研究思路与技术路线 |
1.3 研究方法及其适用性 |
1.3.1 主要研究方法 |
1.3.2 生存分析模型的适用性 |
1.4 本文创新点 |
第二章 相关理论基础与文献综述 |
2.1 相关理论基础 |
2.1.1 客户生命周期理论 |
2.1.2 客户生命价值理论 |
2.2 国内外研究综述 |
2.2.1 流失客户的定义 |
2.2.2 客户流失预测模型与方法 |
2.2.3 生存分析在客户关系管理中的应用 |
2.2.4 客户挽留相关研究 |
2.3 本章小结 |
第三章 电子商务客户生存时间分布规律 |
3.1 数据收集与预处理 |
3.2 电子商务客户生存函数的构造与表示 |
3.2.1 电子商务客户流失事件定义 |
3.2.2 电子商务客户生存时间及删失 |
3.2.3 电子商务客户生存时间的函数形式 |
3.3 电子商务客户生存函数的估计与检验 |
3.3.1 电子商务客户生存函数的K-M估计 |
3.3.2 电子商务客户生存分布的Log-rank差异性检验 |
3.4 电子商务客户生存时间分布规律的描述与比较 |
3.4.1 电子商务客户生存时间的整体分布 |
3.4.2 不同删失数据处理方式下的客户生存曲线比较 |
3.4.3 客户生存时间分布差异的统计分析 |
3.4.4 不同消费特征下的客户生存曲线比较 |
3.5 本章小结 |
第四章 电子商务客户流失风险的影响因素分析 |
4.1 Cox模型指标选择与处理 |
4.1.1 建模指标选择 |
4.1.2 连续型变量离散化的最优切点 |
4.2 电子商务客户流失Cox比例风险模型的构建与分析 |
4.2.1 Cox比例风险模型的构建 |
4.2.2 协变量系数的估计 |
4.2.3 模型结果及流失风险因素分析 |
4.2.4 模型的PH假定诊断 |
4.3 电子商务客户流失Cox比例风险模型的改进 |
4.3.1 分层Cox比例风险模型 |
4.3.2 引入时间交互项的非比例风险模型 |
4.4 电子商务客户流失三个Cox模型的比较与讨论 |
4.5 本章小结 |
第五章 电子商务多客户流失的挽救策略 |
5.1 挽救模型的参数定义与假设 |
5.2 多客户流失挽救模型的构建与求解 |
5.2.1 挽留利润的计算 |
5.2.2 是否挽救及挽救次序 |
5.2.3 最优挽救成本 |
5.2.4 最优挽救比例 |
5.3 电子商务多客户流失的挽救策略实证分析 |
5.3.1 实验Ⅰ:模型的应用 |
5.3.2 实验Ⅱ:模型的有效性验证 |
5.4 本章小结 |
结论与展望 |
参考文献 |
致谢 |
个人简历 |
在学期间的研究成果及发表的学术论文 |
(4)随访研究中两个问题的探讨(论文提纲范文)
缩略词汇表 |
摘要 |
Abstract |
1 前言 |
2 研究目的 |
3 原理与方法 |
3.1 研究方法 |
3.2 两组生存时间的产生 |
3.3 删失数据的产生 |
3.4 采用log-rank检验或Cox模型进行分析 |
4 第一部分 |
4.1 模拟实验设计 |
4.2 参数设置 |
4.2.1 当生存数据服从指数分布 |
4.2.2 当生存数据服从Weibull分布 |
4.3 考核指标 |
4.4 结果 |
4.4.1 指数分布情形,一类错误与估计偏差 |
4.4.2 指数分布情形,检验效能和估计偏差 |
4.4.3 Weibull分布情形,一类错误和估计偏差 |
4.4.4 Weibull分布情形,检验效能和估计偏差 |
4.5 结论 |
5 第二部分 |
5.1 模拟试验设计 |
5.2 参数设置 |
5.3 考核指标 |
5.4 模拟实验结果 |
5.5 模拟实验结论 |
6 讨论 |
6.1 研究主要结论 |
6.2 关于一类误差的变化 |
6.3 关于Cox模型 |
6.4 应用建议 |
6.5 研究存在的不足 |
7 参考文献 |
综述及参考文献 模拟研究中生存资料随机数的产生方法 |
参考文献 |
攻读学位期间论文发表情况 |
致谢 |
(5)新农合对劳动供给、贫困缓解的影响研究(论文提纲范文)
摘要 |
Abstract |
第一章 导论 |
1.1 研究背景与意义 |
1.2 研究目标与研究内容 |
1.3 研究方法与数据 |
1.4 本研究可能创新之处 |
第二章 理论基础和文献综述 |
2.1 理论基础 |
2.2 文献综述 |
2.3 对文献研究的评述 |
第三章 新农合对劳动供给、贫困缓解的作用机理 |
3.1 新农合的发展历史与实施情况 |
3.2 新农合影响劳动供给的作用机理 |
3.3 新农合缓解农户贫困的作用机理 |
3.4 本章小结 |
第四章 新农合对劳动供给影响的实证分析 |
4.1 实证模型、研究样本与变量 |
4.2 反事实检验 |
4.3 新农合对劳动供给的影响估计 |
4.4 稳健性检验 |
4.5 本章小结 |
第五章 新农合对不同群体劳动供给的影响分析 |
5.1 新农合对劳动供给影响的性别差异 |
5.2 新农合对劳动供给影响的年龄差异 |
5.3 不同健康状况下新农合对劳动供给的影响分析 |
5.4 不同收入水平下新农合对劳动供给的影响分析 |
5.5 本章小结 |
第六章 新农合对农户贫困缓解作用的实证分析 |
6.1 数据处理 |
6.2 农户贫困的生存函数估计 |
6.3 贫困风险模型构建 |
6.4 结果分析 |
6.5 收入差异下新农合及其他公共政策的"逆向选择" |
6.6 本章小结 |
第七章 新农合对农户因病致贫的缓解作用差异 |
7.1 交通基础设施的差异 |
7.2 医疗服务资源供给的差异 |
7.3 本章小结 |
第八章 贫困农户的慢性病与劳动供给分析——以高血压病为例 |
8.1 理论分析框架 |
8.2 实证模型、研究样本与变量 |
8.3 高血压病对农户夫妻劳动供给影响的实证分析 |
8.4 配偶高血压病影响农户夫妻农业劳动时间的中介效应检验 |
8.5 高血压病贫困患者的医疗服务利用分析 |
8.6 本章小结 |
第九章 研究结论与政策建议 |
7.1 主要研究结论 |
7.2 政策建议 |
7.3 研究不足与展望 |
参考文献 |
附录 |
致谢 |
作者简介 |
(6)二项抽样下基于鞍点逼近方法的流行病相对风险置信区间构造(论文提纲范文)
1 引言 |
2 相对风险的置信区间估计方法 |
2.1 Delta方法 |
2.2 对数转换方法 |
2.3 基于Fieller定理的改进 |
2.4 基于似然比检验方法 |
2.5 得分检验方法 |
2.6 利用鞍点逼近构造置信区间 |
3 实例分析 |
4 蒙特卡洛模拟比较 |
4.1 区间估计评价标准 |
4.2 模拟结果 |
4.3 模拟结果比较 |
5 结论 |
四、聚类抽样情形下基于广义线性模型的风险比估计(论文参考文献)
- [1]基于广义估计方程的多元失效时间数据的相关性研究[D]. 高天雄. 大连理工大学, 2021(01)
- [2]脆弱模型在层次生存数据中的比较及在睡眠与死亡或心血管事件关联中的应用研究[D]. 王闯世. 北京协和医学院, 2019(02)
- [3]电子商务客户流失的生存分析模型及挽救策略研究[D]. 张珠香. 福州大学, 2018(03)
- [4]随访研究中两个问题的探讨[D]. 陈梦锴. 南京医科大学, 2017(01)
- [5]新农合对劳动供给、贫困缓解的影响研究[D]. 沈政. 中国农业大学, 2017(08)
- [6]二项抽样下基于鞍点逼近方法的流行病相对风险置信区间构造[J]. 钱政超,张晨阳,孟令宾,田茂再. 数学的实践与认识, 2014(21)
- [7]聚类抽样情形下基于广义线性模型的风险比估计[J]. 邓伟奇,张忠占. 应用数学, 2004(S2)