nhtong的个人博客分享 http://blog.sciencenet.cn/u/nhtong

博文

调查结果 ——喝高度(40度及以上)白酒是否有助于预防新冠病毒感染

已有 5681 次阅读 2023-1-8 00:25 |个人分类:未分类|系统分类:科普集锦

调查结果

——喝高度(40度及以上)白酒是否有助于预防新冠病毒感染

同宁华 202317日)

 

  前些天元旦假期,在家无事,看到微信上的一些视频,在谈论喝高度白酒和预防新冠病毒感染的问题。我看到的主要是如下两则视频:一则是一位先生叙述他参加朋友聚会的事情。参加聚会者多有感染新冠,但喝高度白酒的四位(包括他在内)至今没有感染;另一则是一位先生介绍他的德国导师Krueger教授教给他的“克雷格尔防毒法”,是用高度白酒预防感染病毒的方法。

对这些说法,我感到很好奇:白酒真的有这个功效吗?于是我留心观察了一下。在我的朋友中间,也有一位每天时不时喝点白酒,至今没有感染新冠病毒。在2022年岁尾一天我打车出行,和滴滴司机聊天。他说他至今未阳。我随口问了一句:您平时喝酒吗?司机答曰:我每天晚饭必喝一两白酒。这也算是一桩奇遇。

当然,这些网上的视频也好、遇到的人和事也好,虽是亲身经历、或某人亲测有效,但仍然无法证明(或证伪)饮用高度白酒对新冠感染有预防作用。原因是一则,我也听到周围很多朋友提起:某某也每天喝酒,但仍然感染新冠,云云。二则,人群中有一定比例的人本来就是不会被感染的。如果这些人中的某位恰好喜欢每天喝点白酒,就容易把未感染这个结果错误归因到白酒上去。所以,对于“喝高度白酒是否有助于预防新冠病毒感染”这个问题,比较科学的办法是统计调查。只有用概率论的语言才能合理地解答这个问题。

于是,202311日,我用“问卷星”小程序做了一个非常简单的调查问卷,希望对这个问题做一个小小的研究。这个研究几乎不花费什么成本,而得到的结果可能有参考价值。对于非统计专业人士的我来说,问卷肯定是做得越简单越好。我的问卷只包含两个单选题:

(1)您的状态:

单选 a.阳康或阳中; b.未阳。

(2)您喝高度白酒(40度及以上)的频次:

单选 a.偶尔、几乎不喝; b.每周一到两次; c.每周三次及以上。

我在一些微信群里面发布了这个调查问卷,还动员亲戚朋友帮助转发。从1月1日15:00发布开始,到1月3日24:00为止,共回收了211份问卷。在这之后,我发现数据的增加速度非常缓慢,几乎没有人再回复这个问卷了。估计这个问卷已经被群内的各种聊天淹没了吧。

这211份数据的简单分析给出了一些挺有意思的结果。在这里我给感兴趣的朋友们分享一下。也希望这个结果对抗击新冠疫情有一点点贡献。

image.png

图一、感染和未感染人数分布

图一是从回收的这211份问卷结果统计出的感染和未感染新冠人数占比。“未阳”的53人,占比25.1%。“阳康或阳中”的158人,占比74.9%。这个比例与最近网上各方面统计的数据还是大概一致的。从问卷星给出的问卷地域分布可以看出,这211份问卷来自全国各地(但没有来自西藏、新疆、青海的),有一定代表性。

image.png

图二、喝酒频率的分布

   图二是从这211份回收问卷中统计出的喝高度(40度及以上)白酒的频率分布。在211人中,“从不或偶尔喝酒”有139人,占比65.9%,“每周喝酒1-2次”有28人,占比13.3%,“每周喝3次及以上”有44人,占比20.8%。这个结果有点出乎意料:每周喝至少一次高度白酒的人竟然占到参与答卷总人数的34.1%。没想到啊,我的朋友圈(或关联的朋友圈)中有这么多爱酒人士!平时没有听说很多人爱喝白酒啊?——估计,这个饮酒比例应该显著高于真实的值!

对这个结果,一位朋友给出了一个解释:既然这个问卷调查与喝酒有关,那么大家在转发问卷的时候,就可能更倾向于转给经常喝酒的朋友。所以在回复问卷的人当中,喜欢喝酒的人所占比例会高于真实比例。嗯,这个解释貌似有道理哦!

还有一个反常:每周喝酒3次及以上的人数占比,要高于每周喝酒1-2次的人数占比。这明显不符合正态分布。难道喝酒频率的分布不是单中心分布,而是双峰形状?也许,这也是采样过程带来的失真。也许,人群中的真实情况就是如此:要么滴酒不沾,要么每日必喝,而每周只喝一次的人反而很少。

无论如何,上面这个失真的喝酒比例应该不会严重影响调查新冠感染与喝酒频率之间关联。因为我只需要调查喝酒人士中新冠感染比例与不喝酒人士中新冠感染比例是否存在显著差异,就能给出结论。

image.png

表一、不同喝酒频率的人群中,新冠感染比例统计表


表一给出了按照不同喝酒频率,对新冠感染比例做分类统计所得到的数据。这个数据就是这次调查的主要结果。可以看出来,在“从不或偶尔喝酒”的人群(139人)中,新冠未阳有29人,占比20.9%;在“每周1-2次喝酒”的人群(28人)中,未阳有7人,占比25.0%;在“每周喝酒3次及以上”的人群(44人)中,未阳17人,占比38.6%。在所有的211人中,未阳53人,占比25.1%

image.png

图三、“未阳”比例随喝酒频率的变化

把这个数据画成曲线就是图三。结果居然很简单:“未阳”的比例随每周饮酒频率单调递增!最高饮酒频率这一组44人中,有17人未阳,未阳比例高到38.6%,几乎达到了最低饮酒频率这一组20.9%未阳比例的两倍。从直观上看,这个结果支持“喝高度白酒有助于预防新冠感染”。

下面,还需要从统计的角度分析一下:如果未阳的比例其实与喝酒无关,而这次调查所得到的上述结果,完全是出于运气不好,是抽样过程中偶然产生的假象,那么这种事情发生的概率有多大?这个概率越小,表明这次统计给出的结论越可靠,有较高的“显著性水平”。如果这个概率大于10%,那么所得结论就可能是出于数据的涨落等偶然因素,没有统计意义。

我们做一个最简单的显著性检验。假设人群中未阳的真实比例接近这次调查的数据,简单取为p0=25%。我们专门挑“每周喝酒3次及以上”这一组来研究,分析这一组的未阳比例。取总体为“每周喝酒3次及以上”的人的感染状态X。X是一个0-1型随机变量,取两个可能的值:1(未阳)或0(阳康或阳中)。X=1的概率记为p;则X=0的概率为1-p。p是一个客观存在但是未知的数字。我们把这次调查给出的饮酒频率最高的一组的数据,视为一个容量为N=44的简单随机样本(X1,X2,...,X44)。样本观察值中有171(未阳),270(阳康或阳中)。我们的任务就是要通过这些样本观察值,判断是否有显著的证据表明,这一组的未阳概率p是否显著大于一般人群的未阳概率p0。要做的假设检验问题可以陈述为:

原假设H0:喝高度白酒每周三次及以上不能预防新冠感染(p=p0);

对立假设H1:喝高度白酒每周三次及以上能够预防新冠感染(p>p0)。

对这个假设检验,我们取检验统计量为<X>=(X1+X2+...+X44)/44。由中心极限定理,<X>近似服从参数为μ=μX,σ=σX/sqrt(44)的正态分布。其中,μX=p是总体均值,σX=sqrt[p(1-p)]是总体的标准方差。如果原假设H0成立,即p=p0=25%,可以求得<X>~N(0.25,0.0652)。样本观察值<x>=17/44=0.386。在原假设H0成立的前题下,检验统计量<X>取值在观察值<x>右侧的概率可求得为P(<X> > <x>)=1-Φ(2.09)=0.018。也就是说,如果原假设H0成立,那么“每周喝酒三次及以上”这一组的统计观察值<x>,落在了理论均值右侧2个σ以外。理论上出现这种情况以及更极端的情况的总概率只有0.018。这说明完全由偶然因素导致观察到这样的结果是一个小概率事件,不大可能在一次抽样中发生。因此,只能拒绝原假设H0。由于<x>=0.386 > p0,我们可以接受备择假设H1,也即接受“喝高度白酒每周三次及以上能够预防新冠感染(p>p0)”。按照统计学的说法,由于样本观察值发生的概率P(<X> > <x>)介于0.01与0.05之间,我们拒绝假设H0的依据是强的,犯错误的概率不超过0.018。

综上所述,这次调查的结论是:有显著的证据表明“每周喝高度白酒三次及以上有助于预防新冠感染”。

如果考虑到人群中真实的饮酒比例没有这次调查数据反映的那么高,那么真实的未阳概率会更加靠近不喝酒的人群的值,也就是更接近20.9%。这样p0会比前面分析中所用的25%更低一些,则此次检验的显著性水平会更高一些。

  需要说明的是,由于本人并非统计学家,也不是医学专家或者病毒学专家,这个简单的调查可能存在很多问题。从统计学的角度来看,这次调查的问卷设计、抽样方法、数据分析都可能存在很多瑕疵或错误。所得结论是否正确、有何意义,这一点仁者见仁,最终还是需要由专业人士来检验。目前,可以权把这个调查看作是本人出于好奇而做的一个抛砖之举吧。




https://blog.sciencenet.cn/blog-44123-1371007.html

上一篇:空气质量监测数据网站
收藏 IP: 223.72.77.*| 热度|

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-27 09:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部