logistic回归 如何_logistic回归的OR值如何解读,我收藏的这篇文章分享给你

daf4feca6e7e287d2b92e14a2a772cd2.png via:医学统计分析学习笔记 本文4914字〡18图 Hosmer DW和Lemeshow S合作发表了多篇有关logistic回归模型的研究文献,于1989年出版了《Applied Logistic Regression》一书,在SPSS软件二元logistic回归“选项”对话框中,可以看到“Hosmer-Lemeshow”(霍斯默-莱梅肖检验)用于模型拟合优度检验。 书中“The Low Birth Weigh Study”关于低出生体重婴儿影响因素的研究,可以作为学习logistic回归模型较好的数据案例,该研究的结局变量为是否分娩出低体重婴儿(<2500g),收集的自变量有:产妇年龄、体重、种族、妊娠期间是否吸烟、本次妊娠前早产次数、是否患有高血压、应激性等。   某研究者比较关注吸烟与出生低体重婴儿之间的关系:  如果存在关联,那么关联的强度或者影响有多大呢?  又该用什么统计量来表明?

1优势比概念


首先,我们将是否出现低体重婴儿按照产妇妊娠期间有无吸烟整理成四格表资料的形式, 如下表所示,把这个研究看成一个病例对照,了解OR值计算的基本思路。 88a5365ddd636015adaa0461006ab5b3.png
在病例对照研究中
,OR值(Odds ratio)表示病例组某因素的暴露比值与对照组该因素的暴露比值之比,可以反映病例组某因素的比例为对照组的若干倍,在本例中可以分析吸烟和是否出现低体重婴儿之间的关联强度。
病例组 (低出生体重)的暴露 (吸烟)概率=30/59; 病例组 (低出生体重)的非暴露 (未吸烟)概率=29/59;病例组 (低出生体重)的暴露 (吸烟)与非暴露 (未吸烟)的比值
(Odds)=(30/59)/(29/59)=30/29;
同理
,对照组 (正常出生体重)的暴露 (吸烟)与非暴露 (未吸烟)的比值(Odds)=44/86;OR=Odds (病例)/Odds (对照)
=(30/29)/(44/86)
=2.022
在SPSS软件【交叉表】统计的【Risk】(风险)中,可以输出优势比(OR值), 如下图所示98c6898f45c7406687d9ab84df7da37b.png
由产妇在妊娠期间是否吸烟(吸烟/不吸烟)的比值比可知:产妇妊娠期间吸烟出现低出生体重婴儿的危险是未吸烟的2.022倍,OR的95% CI(1.081,3.783), 如下图所示fd89bd3dd9a971a9aec1401cfe03c70e.png

2回归系数和OR值


logistic回归模型的回归系数和OR值关系密切,类似于线性回归, β0 表示模型中所有自变量均为0时,In(Odds)的值;回归系数 βj 表示,在控制其他自变量时,自变量 Xj 每增加一个单位引起的In(Odds)的值的改变量。 根据logistic回归模型公式,可得: 67abd006a468347a8b6dea2cffed4595.png改写上述公式,变量 Xj增加一个单位后与增加一个单位前优势比的对数等于 βj 2473f2134976438fb4c7329ae0f4e846.png同时,自变量 Xj增加一个单位后与增加一个单位前优势比的对数等于 eβj b16c4bd003cf10f5790a0ee8898d2f74.png 如果我们将是否出现低体重婴儿作为因变量,妊娠期间是否吸烟作为自变量,进行logistic回归分析,求得的回归系数β为由不吸烟到吸烟优势比的对数,即In(2.022)=0.704,同时也有e0.704=2.022,结果如下图所示,OR值计算结果同交叉表“Risk”中一致:以未吸烟为参照,产妇妊娠期间吸烟出现低出生体重婴儿的危险是未吸烟的2.022倍。 e5944bd05b69fe0500dbb66bf0443541.png
虽然OR值,在交叉表下【Risk】分析结果与单因素logistic回归分析时一样,但是我们采用多因素logistic回归分析是为了校正混杂因素或者筛选危险因素,分析校正后的OR值,此时交叉表【Risk】分析就无能为力了。 在logistic回归模型中,优势比可以作为估计效应大小(Effect Size)的指标,度量某自变量优势影响程度的大小,OR值的意义:
  • OR=1,表示该因素对疾病的发生不起作用;

  • OR>1,表示该因素是危险因素;

  • OR<1,表示该因素是保护因素;

3校正OR值


未校正混杂因素的 OR 称为粗优势比(Crud odds ratio), 如下图所示 ,自变量只纳入产妇妊娠期间是否吸烟,此时妊娠期吸烟出现低体重婴儿的风险是未吸烟的2.022倍,OR的95% CI (1.081,3.783)。 956accaa21eccd4251a2fb9a1378a687.png 校正混杂因素作用后的OR称校正OR(Adjust odds ratio),如下图所示,自变量纳入产妇妊娠期间是否吸烟、产妇是否患有高血压,在校正高血压因素后,产妇妊娠期吸烟出现低体重婴儿的风险是未吸烟的2.038倍,OR的95%CI(1.081,3.843)。 1dcdded7aff161cc74920c21f0f32228.png

4OR值置信区间


logistic回归分析结果除了报告OR值,还应报告其置信区间,自变量 Xj 的置信区间计算公式如下: 80061a638d5b37c360cdd7e70b1ebf87.png 1dcdded7aff161cc74920c21f0f32228.png
产妇是否患有高血压为例,由 b=1.230, Sb=0.618, 按照上述置信区间估计公式,可 计算OR的95%CI, e (1.230±1.96*0.618) =(1.02,11.48)。在SPSS软件中,二元logistic回归的【 选项】对话框“Exp(B)的置信区间95%”勾选后, 如下如图所示,即可输出OR值置信区间。 1f7e98221141064dae2822b37e4501a0.png

5如何在论文中展示OR值


在文献中,有表、图两种形式展示 OR 值以及95% CI,如下面几张图表,图1为表格式,在中文文献中比较常见;在SCI中很多使用森岭图展示,如图2、图3 ;也有部分文献使用图4,对调了横纵坐标的森岭图 。 3499ac5decff55b2555d4daf32be7084.png JAMA. 2018;320(10):1017-1026. doi:10.1001/jama.2018.12498 70f7003d833b2e699f8cea3c3fad5c08.png JAMA. 2006;296(3):301-309. doi:10.1001/jama.296.3.301 a5eed05084287a9085465784477ed241.png JAMA. 2010;303(23):2377-2385. doi:10.1001/jama.2010.808 4b1a4f306e6feb57c8bbd32c50dafaf5.png JAMA. 2009;301(24):2553-2562. doi:10.1001/jama.2009.886

6OR值分析注意事项


2018年7月,在JAMA杂志上,Norton EC等发表了题为《 Odds Ratios—Current Best Practice and Use 》的文章, 作者认为logistic回归模型较容易计算OR值、可以调整风险因素、分析关联强度,因此被广泛应用,但是存在下面三个局限: (1)  The interpretation of odds ratios is framed in terms of odds, not in terms of probabilities. Odds ratios often are mistaken for relative risk ratios. (2)  The magnitude of the odds ratio from a logistic regression is scaled by an arbitrary factor. (3) There is no unique odds ratio to be estimated, even from a single study. f66d701ed401cbbbc07bb2c7c4baa01e.png JAMA , 2018, 320(1):84-85. doi:10.1001/jama.2018.69712017年5月, Norton ECDowd BE在 《 Health Services Research 》在杂志上发表了题为“Log Odds and the Interpretation of Logit Models”的文章,作者认为OR值都是基于特定数据和模型得到的,不应跨研究比较(来自不同总体的样本),也不应在不同模型中比较(来自不同解释变量)88fa265433da1839cd838f85b817434f.png HSR,  2017,5(31).doi: 10.1111/1475-6773.12712.2001年, Holcomb WJ等在《 Obstetrics & Gynecology》杂志,发表题为“ An odd measure of risk: use and misuse of the odds ratio”的文章, 以确定OR值在妇产科临床研究中应用频率、OR值估计的实质性差异,并评估这些差异是否导致对研究结果的误读。 结果:在151篇使用OR值的研究中,107篇合理使用。与RR值相比,OR值放大了效应。39篇( 占比 26%)将OR值误解成RR值,且无明确的理由。 结论:在妇产科临床研究文献中,OR值被广泛使用,且经常误解。此外, 根据OR值的数理特征,得出的定量结论可能存在风险。 714d75d19b6fc994c68b5fdede24b796.png Obstetrics & Gynecology,  2001, 98(4):685-688.  doi:10.1016/S0029-7844(01)01488-0.在三篇文献中,作者都提到 勿将OR值和RR值(相对危险度)混淆,当研究结果的阳性概率较小时,OR值的大小与发生概率比较接近,此时OR值可以反映RR值, RR值、OR值区别如下RR值( Relative risk, RR)常用在队列研究中,表示暴露组的发病率或者死亡率(或者发病风险)与非暴露组的发病率或者死亡率(或者发病风险)之比,反映暴露组疾病风险是非暴露组的多少倍。 OR值(Odds ratio, OR)常用在病例对照研究或者横断面研究,表示病例组某因素的暴露比值与对照组该因素暴露比值之比,反映病例组该因素暴露比例为对照组的多少倍。 参考文献 : [1]方积乾.卫生统计.第七版.北京:人民卫生出版社,2018. [2]张文彤,董伟.SPSS统计分析高级教程.第2版.北京:高等教育出版社,2013. [3]Morris MC,Brockman J,Schneider JA,et al. Association of Seafood Consumption,Brain Mercury Level,and APOE ε4 Status With Brain Neuropathology in Older Adults[J]. JAMA, 2016, 315(5):489. [4]Despriet DDG , Klaver CW , Witteman JCM , et al. Complement factor H polymorphism, complement activators, and risk of age-related macular degeneration[J]. American Journal of Ophthalmology, 2006, 142(4):0-717. [5]Johansson, Mattias. Serum B Vitamin Levels and Risk of Lung Cancer[J]. JAMA, 2010, 303(23):2377. [6]Hosmer DW, Lemeshow S. Applied logistic regression[M]. 1989. [7]Norton EC, Dowd BE, Maciejewski ML. Odds Ratios-Current Best Practice and Use[J]. JAMA, 2018, 320(1):84-85. [8]Norton EC, Dowd BE. Log Odds and the Interpretation of Logit Models[J]. Health Services Research, 2017,5(31),doi: 10.1111/1475-6773.12712. [9]Holcomb WJ, Chaiworapongsa T, Luke DA, et al. An odd measure of risk: use and misuse of the odds ratio[J]. Obstetrics & Gynecology, 2001, 98(4):685-688.

72539e90020a279394d82c2ceabc9a5d.png

  • 13
    点赞
  • 87
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
单因素 logistic 回归和卡方检验在统计学中常常一起使用,特别是在进行二分类问题的分析时。这两种方法可以帮助我们理解自变量与因变量之间的关系,并评估其统计显著性。 在以四格表为例的情况下,我们通常会使用卡方检验来评估自变量(例如某个特征)与二分类的因变量之间的关系。四格表是一个二维的交叉表,其中行表示特征的两个水平,列表示因变量的两个水平。每个格子中的数字表示在该特征水平和因变量水平下的观察数量。 卡方检验基于观察到的数据与期望的数据之间的差异来评估特征与因变量之间的关联性。它使用卡方统计量来计算观察与期望之间的差异程度。如果差异显著,则说明该特征与因变量之间存在统计学上的关系。 当卡方检验结果表明特征与因变量之间存在显著关系时,我们可以进一步使用单因素 logistic 回归来解释这种关系。logistic 回归用于建立一个预测模型,该模型可以根据自变量(特征)的来预测因变量(二分类结果)的概率。 在 logistic 回归中,我们通常使用 odds ratio(OR)来解释自变量对因变量的影响。OR 是两个比例之间的比,表示一个事件发生的几率。它描述了自变量水平之间的相对几率差异。 通过 logistic 回归分析,我们可以计算出每个自变量水平的 OR ,并解释其对因变量的影响。OR 大于1表示该自变量水平相对于参考水平具有更高的发生几率,OR 小于1表示具有更低的发生几率。 综上所述,单因素 logistic 回归和卡方检验在解释自变量与因变量之间关系时是相互关联的。卡方检验可以用来评估特征与因变量之间的统计显著性,而 logistic 回归则可以通过计算 OR 来解释特征对因变量的影响。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值