logistic回归应用的常见问题有哪些

logistic回归应用的常见问题有哪些,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

水城ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为创新互联建站的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:028-86922220(备注:SSL证书合作)期待与您的合作!


医学研究尤其是流行病学研究中,常见分析疾病(结局)与多种因素(暴露)之间的定量关系。当结局为分类(二分类、多分类)资料时,为研究多种因素共同作用及其交互作用对结局的定量影响,可以采用Logistic 回归( Logistic regression) 分析方法。Logistic回归属于概率型非线性回归的一种多变量分析方法。随着计算机技术的发展,越来越多Lo-gistic回归被应用于医学研究,随之也常常出现误用及结果解释不当的问题。本文主要讨论Logistic回归应用中有关建模与结果解释方面的常见问题。            

二元logistic回归分析

优势比的意义            

注意,OR的应用及解释存在以下误区

1)认为OR> 1代表为危险因素,OR<1代表为保护因素。事实上,OR代表应变量与自变量之间联系的强度,需要根据研究结局进行专业意义的解释。

如果研究结局是正性事件,如疾病治愈、生存,则OR>1代表为促进疾病治愈、促进生存的保护因素,而OR<1代表为不利于正性事件的危险因素;

当研究结局为负性事件,如疾病发生、进展、死亡等,则OR> 1代表为危险因素,OR<1代表为保护因素。

2)将OR与相对危险度(relative.risk,RR)含义混淆。RR是暴露组与未暴露组的研究结局发生率之比,它是一个比值,代表暴露于某个因素的研究结局发生率是未暴露组的多少倍。而OR是优势比,可以理解为工;每改变一个单位时,研究结局的发生风险改变量。只有发生率很低的研究结局,即P很小时,OR才近似等于RR。

哑变量的设置            

【在Logistic回归中 设置哑变量】

 Logistic回归中最常见的自变量类型为多分类变量,如分娩方式分为顺产、难产、剖腹产,婴儿喂养方式分为母乳喂养、混合喂养、人工喂养。有些研究者将多分类自变量误作为连续型变量引人Logistic模型进行分析,这意味着该变量各:相邻分类水平间是等距的,显然不符合实际逻辑。例如,有研究对合肥市城区低出生体重儿影响因素的Logistic回归分析中,原作者将“父亲职业”这个分类变量分为“体力劳动”、“体力兼脑力劳动”、“脑力劳动三个分类水平,进行Logistic回归分析时却将该变量作为有序分类(等级)变量赋值为各分类水平的得分,按连续变量进行处理欠妥。

此外,如果研究者想观察分类变量的各暴露水平对研究结局的影响,也可以将有m个分类水平的变量转变为m个哑变量(取值0或1),每个哑变量分别代表有无该水平的暴露(取值1代表有,取值0代表无)。例如,有研究对儿童慢性胃炎、消化性溃疡致病危险因素的Logistic回归分析中,对于膳食模式这个3分类变量(喜爱蔬菜/水果/肉食),可转变为3个哑变量(分别表示“是否喜爱蔬菜”、“是否喜爱水果”、“是否喜爱肉食”)。

变量筛选            

Logistic回归模型建立时,如自变量较多,可采用逐步回归法进行变量筛选。不同的筛选方法有时会产生不同的模型。判断某个变量是否显著以及作用大小,与模型中所包含的变量有关。实际工作中衡量某些变量是.否选人模型,需要考虑专业背景、研究目的、用以调整的某些重要混杂因素以及模型的可解释性、节约性等。

logistic分析结果解释

【回归分析最强总结】

变量的参照水平设置

实际工作中,有些论文作者在Logistic回归模型的结果展示中只标注自变量中文名称和回归系数,未说明各变量的参照水平设置。在回归系数的解释上,也只说明自变量对研究结局是危险或保护因素,未考虑实际专业意义。

下图能更清楚说明问题。父亲肥胖的儿童更容易发生超重和肥胖,其风险是父亲体重正常者的1. 976倍;而相较于出生体重≥4000g的儿童,出生体重在2500~4000g是儿童超重肥胖的保护因素。

 logistic回归应用的常见问题有哪些

关于logistic回归应用的常见问题有哪些问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。


新闻标题:logistic回归应用的常见问题有哪些
URL分享:http://ybzwz.com/article/poihph.html