美捷登官方博客分享 http://blog.sciencenet.cn/u/medjaden

博文

多元分析方法运用——如何正确纳入混杂变量

已有 651 次阅读 2019-7-2 09:37 |系统分类:科研笔记

目前,多元分析方法,如线性回归、Logistic回归和Cox回归等,在观察性临床研究中正得到广泛的使用,其要求将混杂变量带入方程以排除其对结局变量的,从而显现出自变量(预测变量)对因变量(结局变量)的相对独立作用。然而多元分析方法使用过程中凸显了一个问题就是混杂因素的收集不全或者不正确进而导致带入方程的变量不全或不正确,这样的研究得出的结论就缺乏说服力,不能作为循证医学的证据。除了少数特殊情况下,比如匹配,不需要测量收集混杂变量,多数情况下都是需要测量混杂变量才可以排除它的影响。另外,有些因素如果被误认为是混杂因素而代入到多元分析方程中,则会得出错误的结论。所以,提高临床研究质量的关键因素之一就是明确混杂变量的收集测量。


混杂因素的定义其首先是可以影响结局变量,同时要求其与预测变量相关(是预测变量的原因、与预测变量伴随或与预测变量有共同的原因,但不是预测变量的结果)。另一种更好理解说法是,混杂变量是其它研究中的预测变量。混杂因素是可以影响结局变量的因素,这一点是明确的,其它研究已经明确的或疑似的结局变量的因素都可以被确定为可能的混杂因素,至于第二点“与预测变量有关联”就相对模糊,并且通过某种变通找出两个因素有联系的合理性的情况是常见的,所以在实际操作中,以第一个条件为准,通过全面浏览文献,查询循证医学数据库或是咨询有经验的研究者等方式确定研究中需要测量混杂因素是合理的。


特别推荐查uptodate临床顾问等循证医学数据库,对疾病的影响因素有总结和筛选,是确定研究混杂因素的方便有效的途径。需要确定混杂因素的另一个原因是,某些因素被误认为是混杂因素而纳入到多元方程中会造成计算得出预测变量与结局变量之间虚假的关联。


这样的因素包括

1.中介因素:混杂因素的定义中会特别提到预测变量不能是待确定因素的原因,因为这样的因素属于中介因素,其原理可以参照李楠等的论述[1]

2.共享效应:指的是多如何个原因(不局限于预测变量和结局变量)均可导致的某种情况。如果研究者将这样的变量作为研究的入选标准、匹配变量或可能的混杂变量时,会发生限定共享效应(conditioning on a shared effect)所致的偏倚。

图1:混杂变量、中介变量和共享效应区别简单示意图。中介变量,受预测变量影响,然后影响结局变量;混杂变量,影响结局变量和预测变量;共享效应,同时受结局变量和预测变量的影响。箭头指向受影响的变量。


最后,常见的另外一种情况是多元方程中纳入无关的变量,或许这样的操作对结果并没有太多的影响,但是收集变量的过程会造成人力和物力的浪费。


总之,临床试验中运用多元分析方法过程中,正确纳入混杂因素并避免纳入中介变量和共享效应是保证研究结论确实可信的重要措施。


参考文献:

[1]李楠, 石岩岩, 赵一鸣. 中间变量的识别和控制在证实研究假说中的作用[J]. 中华儿科杂志, 2017, 55(10):770-770.


转自美捷登微信公众号;本文作者:刘岳鹏



往期精彩回顾

↓↓↓

【今日重磅】Journal Citation Reports:你想要的SCI影响因子发布了(可下载最全表格)


SCI收录的中国期刊影响因子最高的竟是它?


留学面面观:我在荷兰神经科学研究所的一年(下)


2018JCR不可不知新亮点------增强版期刊影响因子页面


如果您需要降低文稿重复率,或者有进一步的润色需求,您可以将您的文稿上传到美捷登投稿系统(电脑端)http://online.medjaden.com/control/login新会员注册即可领取豪华礼包(含价值500元论文详细评估一份)


扫描二维码关注“美捷登”微信



http://blog.sciencenet.cn/blog-475824-1187726.html

上一篇:美捷登精彩点评2019年SCI杂志影响因子
下一篇:如何写一篇Meta分析?从实验设计到软件分析

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-8-21 19:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部