思想散步分享 http://blog.sciencenet.cn/u/fqng1008 前三十年写日记,后三十年写博客

博文

[转载]流行病学:因果推断的逻辑方法与因果关系的推断

已有 1553 次阅读 2022-5-15 15:56 |个人分类:比较医学|系统分类:科研笔记|文章来源:转载

在形成病因假设及验证假设的过程中,常用的有两种推理方法:假设演绎法和Mill准则。演绎推理是从一般到个别,从普遍到特殊,它的结论是把前提里的道理缩小范围再讲一次,因而前提真则结论必真。归纳推理是从个别到一般,从特殊到普遍,它的结论是把前提里的道理扩大范围再讲一次,因而前提真则结论只是可能真。

一、假设演绎法

描述流行病学研究包括临床多病例观察、生态学研究和横断面研究等,主要描述疾病的分布,一般不涉及疾病的发生机制或因果关系;能提供病因分析的初步线索,形成病因假设。假设是在为数不多的经验事实以及已有理论的基础上,通过逻辑推理或创造性想象等而形成的。得到假设后,描述流行病学通过假设演绎法同检验假设的分析流行病学研究相衔接。

(一)假设演绎法的推理过程

假设演绎法(hypothetic deductive method)最早由 Hershel提出,对近代科学的发展给予了强有力的推动。该名称中的“演绎”仅仅指待观察的经验事实,可由假设相对于背景知识演绎地推导出来,从一般的假设导出具体个别的事实,就是一个演绎推理。但从具体个别的事实成立而推出一般的假设也成立,则是一个归纳推理。其推理形式为:(1)因为假设H,所以推出证据E(演绎推理)。(2)因为获得证据E,所以反推假设H(归纳推理)。

假设演绎法的整个推论过程为:假设演绎地出具体的证据,然后用观察或实验检验这个证据,如果证据成立,则假设亦成立。从逻辑学上看,反推是归纳的。从一个假设可推出多个具体证据,多个具体证据的经验证实,则可使归纳支持该假设的概率增加。

(二)假设演绎法的应用

在乙型肝炎病毒与原发性肝癌的因果关系的研中,假设H:乙型肝炎病毒(HBV)持续感染导致原发性肝癌(PHC),根据该假设和相关的背景知识以演绎地推出以下若干经验证据:E1(肝癌病例组的HBV感染率高于对照组),E2(HBV感染队列癌发生率高于对照),E3(控制HBV感染后,肝痛的发生率降低)。如果证据E1,E2,E3成立,则假亦获得相应强度的归纳支持。

1.jpg

二、Mill准则

流行病学研究中常采用Mill准则(Mill' s cannon)形病因假设,包括以下几种逻辑推理方法:

(一)求同法

求同法(method of agreement)又称“异中求同法,是指在不同事件中寻求其共同点。例如,在某一地区发生沙门菌引起的食物中毒调查中发现,同的人群如学生、教师及工人中暴露于某可疑食物者发病,未暴露者不发病。又如除男性同性恋艾滋病高发外,静脉吸毒者、接受血液制品者也易发生艾滋病,因此可以推测,血液或体液是该病传播的危险因素。

(二)求异法

求异法(method of difference)又称“同中求异法”,是指在相似的事件之间寻求不同点。如新疆察布查尔病的流行区,锡伯族人发病率较其他族高,流行病学调查发现,锡伯族人吃一种特殊的食物——米送乎乎(自制甜面酱的半成品,意即面酱),由此怀疑该食物是引起该病的原因,经证实该食物被肉毒梭状杆菌毒素污染。

 (三)共变法

共变法(method of concomitant variation)是指某因素出现的频率和强度发生变化,某病发生的频率与强度也随之变化,则该因素很可能是该病的病因,二者间往往呈剂量-反应关系。例如,在吸烟与肺癌的研究中,有明确的研究资料表明平均每日吸烟量越多的人,死于肺癌的概率越大,从而提示吸烟与肺癌之间的关系。

(四)类推法

类推法(method of analogy)是指所研究的某种疾的病因和分布特征与另一种病因已知的疾病的分布特征相似,那么可以推测这两种疾病的因可能相同。例如,克山病的病因未知,但克山病的分布与动物的白肌病的分布一致。动物的白肌病是由于动物缺硒所致,而且克山病的病理变化与动物白肌病的病理变化一致,由此可推测,人类的克山病与动物的白肌病的病因可能有相同之处,即与缺硒有关。给予补硒治疗,克山病的病情得到缓解,进一步证实了这一假设。

(五)排除法

排除法(method of exclusion)指通过对假设排除而建立假设的方法。研究病因的过程中有时会产生若干假设,在许多条件相同的人群中采取排除方法,对已知不可能引起某种医学事件的因素逐一排除,最后保留下来没有任何排除依据的某一因素可能就是引起该医学事件的原因。该方法也是一种逻辑推理方法。1972年上海发生桑毛皮炎的流行 调查组在调查诸多相关的因素中,逐一排除了工厂废气、植物花粉和吸血节肢动物及其毒蛾后,怀疑该病为桑毛虫所致,最后也证实了这一假设。

2.jpg

经过分析流行病学的研究,发现某因素与某疾病有关联时,并不意味着二者间具有因果联系,必须经过大量的流行病学推断,排除虚假关联和间接关联后,才能进行病因推断,而病因推断是确定所观察到的疾病与因素间的关联是否为因果关联的过程。

三、疾病与暴露因素关联的形式

暴露因素与疾病之间的关联,可能是因随机误差所致,也可能是真正具有统计学意义的关联。从流行病学角度看 统计学关联可以是虚假关联或继发关联,也可以是因果关联(病因学关联)。因此,在进行因果推断时必须注意排除各种虚假关联,调整和分析继发关联,从而合理地评价病因学关联。

3.jpg

(一)随机误差和系统误差

误差(eror)是指研究的测得值和真实值之间的偏离,即测定值与真实值之差,包括随机误差(random error)和系统误差(systematic error)两类。随机误差又称为机遇误差(chance error),或称偶然误差(accidental error)。在流行病学研究中,由于研究对象往往是来自某个特定总体的样本,故样本与总体之间必然因被测定的生物学现象(或指标)的随机变异,以及测量方法本身的机变异等原因而存在一定的差别,从而导致实测值(样本)与真实值(总体)之间出现一定的差异,被为“随机误差”。随机误差包括抽样误差和随机测量误差等。随机误差无法避免,可影响研究结的精确性,但可以通过统计学方法予以估计或评价。系统误差又称偏倚(bias),是指在流行病学研究各个环节,包括研究设计、实施、分析和推断过程中,由于研究方法的缺陷或错误,造成对暴露因素与疾病关系的错误估计。偏倚的种类很多,一般将其分为选择偏倚(selection bias)信息偏倚( information bias)和混杂偏倚( confounding bias)。

1.选择偏倚(selection bias)由于选择研究象方法上的错误或缺点,使入选者与未入选者在某些特征上存在差异,造成所选的研究对象不能代表总体,从而导致暴露与疾病之间的联系偏离真实的情况。

2.信息偏倚(information bias)又称观察偏倚(observational bias)或错误分类偏倚(mis-classification bias),是指来自于测量或资料收集方法的问题使得获取的资料存在系统误差。流行病学中错误分类又包括无差异性错分(nondifferential misclassification)和差异性错分(differential misclassification)。如果暴露或疾病的错误分类同研究分组无关,即各组间不存在差异,则称为无差异性错分。它在一定程度上减弱了研究组间的差异,一般使研究效应的估计值偏低(趋向于无效应值或无关联)。如果暴露或疾病的错误分类同研究分组有关,即在各比较组间存在差异,则称为差异性错分。由于错误分类在组间存在差异的方向可能不同,故可造成高估或低估研究效应值。信息偏倚可来自研究对象、研究者、也可来自测量的仪器、设备或方法等。

3.混杂偏倚(confounding bias)是指流病学研究中,在估计暴露与疾病之间的联系时,受到一个或多个既与研究的疾病有密切关系,又与暴露因素有密切联系的潜在危险因素的影响 从而歪曲(低估或高估)了所研究因素与疾病之间的真实联系。引起混杂偏倚的因素称为混杂因素(confounding factor)。当一个潜在混杂因素在研究组间分布不均衡,才能起到混杂作用,产生混杂偏倚。混杂作用可以在任意方向上造成偏差,既可以高估效应也可以低估效应。如有研究表明,打火机携带与肺癌的发生有联系,吸烟是肺癌的重要危险因素,且吸烟又常与打火机携带同时存在,而观察到的打火机携带与肺癌之间的联系是由吸烟所产生的混杂造成的。作为潜在的混杂因素必须具备以下三个特征:混杂因素必须是所研究疾病的危险因素;混杂因素必须与所研究的暴露因素存在统计学联;混杂因素不应是暴露因素与疾病因果链中的一个中间环节。

4.png

(二)虚假关联

虚假关联(spurious association)也称人为关联,指本来两事件间不存在统计学上的关联,但由于在研究过程中,没考虑到设立对照组、对照组选择不当、观察指标不客观、样本的代表性不强或其他偏倚存在,造成暴露与疾病间的虚假关联。如“鸡鸣而天晓”,这种联系就是一种虚假的联系。

(三)继发关联

继发关联(secondary association)是指本来两事件(A,C)不存在因果关联,但由于两事件的发生都与另外一种因素(B)有关,结果两事件间出现了统计学上的联系。例如,年龄长者白发和癌症的发生都很多,若研究白发和癌症之间的关系,很容易得到两者之间统计学上的相关联系,但这种联系是继发关联,不能说白发就是癌症的病因。

(四)因果关联

因果关联(causal association)是指一定的原因生相应的结果。在排除虚假关联和继发关联后,才能对两事件间的因果关联进行判断。因与果在空间上总是相伴存在,在时间上总是先后相随。因果关联有以下几种联系方式:

1.单因单果:一种因素仅可以引起一种疾或结局,而且该疾病或结局只由该因素引起。这是传统的病因观,也是因果关联的特异性概念。事实上这种情况几乎不存在,即使是有“必要病因”的传染病,其病因也不是单一的,因为除了病原体外,还存在宿主易感性等因素的影响。例如,机体感染了结核杆菌后是否发生结核病,与个人的质、营养、免疫状态、劳动条件、环境条件(包括居住密度、经济条件等)等有关。因此,应避免用单一因的观点研究病因,防止得出片面或错误的结论。

2.单因多果:即一个因素可以引起多种疾病或结局。例如,吸烟既可引起慢性支气管炎,又可引起肺癌等20多种癌症,还可使高血压、胃溃等疾病的发病风险增加,从病因的多效应来看,无疑是正确的,但是这些疾病也并非仅仅由吸烟引起。

3.多因单果:即多种因素引起一种疾病或结局。如吸烟、高血压和高血脂可以引起心血管疾病,但是,这些因素并非仅导致这一种疾病。多因单果从疾病发生的复杂性方面解释了病因的致病作用。由此可以看出,多因单果和单因多果都各自反映事物的某个侧面 具有一定的片面性。

4.多因多果:即多种因素可以引起多种疾病结局。如肥胖、缺乏体力活动、吸烟、钠盐摄入过多等可以引起心肌梗死、高血压、结肠癌等疾病。种疾病的多个病因可以是完全相同的,也可以是部分相同的。多因多果全面地反映了事物的本质。疾病的发生是多个病因共同作用的结果,要想定某种因素与疾病间的因果关联,必须按照因果关联的标准进行严格筛选。以上几种关联形式在行病因判断时仅作参考。

5.png

四、因果关联的推断标准

随着流行病学的发展,判断疾病病因的流行病学准也在不断地变化。1840年,Henle首先提出病因诊断的标准,后被Koch扩展,即 Henle-Koch原理,它是病因推断标准的第一个里程碑。在美国“吸烟与健康报告”委员会上提出病因推断的5条标准,这是病因推断标准的第二个里程碑。1964年,Hill在皇家医学会职业医学分会上将标准扩展为9条。目前,这个标准已经成为世界公认的判断病因的标准。

(一)关联的强度(strength of association)

关联的强度是两事件发生频率的相对比。在流行病学中评价关联强度的主要指标常以相对危险度(RR)或比值比(OR)表示。一般而言,关联强度越大,则研究因素与某种疾病的因果关系可能性就越大。在设计和分析都正确的前提下,如果RR≥3,那么两事件间很可能存在因果关联。某因素与某种疾病的关联强度越大,则二者间虚假关联和间接关联的可能性越小 因果关联的可能性越大。例如 吸烟与肺癌的RR值为13.7而吸烟与冠病的RR值为2 因而提示吸烟与肺癌的因果关联的可能性比吸烟与冠心病的因果关联的可能性大。

(二)关联的时间顺序(temporality of association)

因果关联中,有因才有果,“因”一定先于“果”。在确定前因后果的时间顺序上,实验研究、前瞻性研究中容易判断,但病例对照研究或横断面究中则常常难以判断。例如,伦敦烟雾事件后呼吸道和心血管疾病的死亡率上升,欧洲“反应停”大量上市后发生的海豹短肢畸形儿的数量增加,都提示了明确的时间先后关系。

(三)关联的特异性(specificity of association)

关联的特异性是指病因与疾病有严格的对应关系,即某种因素只能引起某种特定的疾病,某种疾病只能由某因素引起。如果某病与多种因素关,或某因素与多种疾病有关,就不能称为特异性。这种关联的特异性一般只适用于传染病,而对大多数非传染病而言,病因关联的特异性并不十分明显。随着人们对疾病病因研究的不断深入,尤其是对慢性疾病病因的探讨,该标准的概念可能是不存在的,或是无用的。所以国内、外的研究者主张放弃这一标准。

(四)关联的可重复性(consistency of association)

关联的可重复性指在不同的人群、不同的地区、不同的时间由不同的研究者用不同的研究方法进行研究均可获得相同的结果。重复出现的次越多,因果推断越具有说服力。与观察性研究相比,实验性研究的可重复性较好,这是因为实验性研究的控制条件较好。如关于吸烟与肺癌关系的流行病学研究中,所有的研究均有相似的结果,因而加强了因果关联存在的可能性。

(五)剂量反应关系(dose-response relationship)

随着某因素暴露剂量的增加,人群中发生某病的频率随之增加、因果联系的强度增大,则认为该因素与该疾病间存在剂量反应关系。在吸烟与肺癌的研究中,有研究资料表明平均每日吸烟量越多发生肺癌的概率越大;而戒烟人群中,戒烟的年限越长,发生肺癌的概率越小,吸烟与肺癌呈现出明显的剂量反应关系。

(六)因素与疾病分布的一致性(coherence of association)

因素与疾病分布的一致性是指研究的因素与疾病二者的分布相符合。有研究者对1900—1950年间某国肺癌死亡率的增加与烟草的消费量之间呈明显的相关关系,提示肺癌与吸烟之间可能存在因果联系。

(七)关联的生物学合理性(biologic plausibility of association)

暴露与疾病的关联,应该具有生物学上的合理,应该符合疾病的自然史和生物学原理,在科学上应“言之有理”,即用现代医学知识可以对做出合理的解释。例如,高血脂症与冠心病的因果关联,与冠状动脉硬化的病理证据以及动物实验结果相吻合。

(八)实验证据(experimental evidence)

观察性研究的结果如能得到实验证据的证实则说服力大大提高。如孕妇服用“反应停”引起胎儿海豹短肢畸形,停止销售反应停,在一个较的潜伏期后病例消失,这一结果极大地支持了反应停与海豹短肢畸形的假设。

(九)相似性(analogy)

相似性是指如果已知某化学物有致病作用,当现另一种类似的化学物与某种疾病有联系时,则两者因果关系成立的可能性也较大。与Mill准的类推法类似。

因果关系的推断过程较复杂,在上述9条标准中,必须满足关联的时间顺序,关联的强度、关联的特异性、关联的可重复性及剂量反应关系等虽然不是必要条件,但也都有极其重要的意义。在因果关联的判断中,满足上述标准的条件越多,因果关联的可能性就越大。但若有些标准不满足,也不能否定因果关联的存在,还要对研究设计进一步考证后才能得出结论。

资料来源:知乎,2021-09-03

28https://zhuanlan.zhihu.com/p/385043646?ivk_sa=1024320u



https://blog.sciencenet.cn/blog-279293-1338650.html

上一篇:思念父亲
下一篇:群缅:曾经的日子

1 冯圣中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-7-2 22:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部