|
旨在将大脑特征与人的特征联系起来的全脑关联研究(Brain-wide Association Studies, BWAS)存在可重复性问题。除了增加样本量,还可以采取哪些措施来提高这些研究的可重复性?
人群全脑关联研究(BWAS)用于将个体间的结构和功能神经成像测量差异与认知和精神疾病特质联系起来。但这些研究一直受到可重复性差的影响,除非它们基于数千人的样本量1。在《自然》杂志上,Kang等人2描述了进一步的设计原则,例如增加个体间变异性的抽样方案,以提高可重复性。
仅在2023年,美国国立卫生研究院(NIH)就在神经成像研究上投资了大约19亿美元(见go.nature.g.sjuku.top/48yzr6u)。目前有两个正在进行的大型研究:ABCD(青少年大脑认知发展)3,该项目正在纵向收集12,000名美国儿童的大脑扫描等信息;以及英国生物银行4,该银行正在收集100,000名英国公民的神经成像、遗传和医学数据。
与这些大型项目不同,大多数早期的BWAS参与者少于100人,中位数样本量少于251。因此,当几个来自大型研究数据的报告显示实际BWAS效应大小——大脑的结构或功能测量与特定特征之间的关系强度——比之前认为的小,需要数千人的样本量才能实现可重复性时,引发了轻微的恐慌5,6。正如早期基因组关联研究(GWAS)中所发生的那样,这些研究用于确定基因变异与可观察特征之间的联系,小样本量、抽样变异性和发表偏见的结合导致了报告过高的效应大小。
普遍认为,在其他条件相同的情况下,对于BWAS来说,较大的样本量优于较小的样本量。然而,高昂的神经成像成本使得使用标准研究者发起的研究资助无法产生超过1,000的样本量。非BWAS神经成像研究,如经典的功能性磁共振成像(fMRI),追踪与特定任务需求相关的大脑活动,可以在数十人甚至单个个体的平均下变得可靠,前提是有足够的重复。在避免群体平均和横断面分析(即在特定时间点从代表性人群中检查数据)的同时,对同一个体进行重复或纵向采样(或两者兼有)的精确映射研究,已经揭示了只有一名参与者的大脑组织和可塑性原理11–13。这是否意味着BWAS必须限于联盟大型研究,或者像生命跨度大脑图表联盟(LBCC,包含100多项研究)这样的元分析样本14,而个别研究人员必须为任务导向的fMRI和精确映射编写资金申请?
为了寻找可以提高给定样本量下可重复性的BWAS设计特征,Kang等人结合了来自UK Biobank、ABCD和LBCC等项目的数据,累计超过100,000个大脑扫描。他们报告说,增加感兴趣变量(如年龄)参与者间变异性的抽样方案可以改善BWAS的可重复性。变量间的真实关系(如身高与年龄的关系)是由生物学设定的,理论上可以通过对所有人类进行抽样来准确测量,但当然这是不现实的。然而,相对于其中心过度抽样感兴趣分布的尾部(例如,就年龄而言,只招募18-24岁和79-85岁的人),平均而言,与均匀抽样相比,将为给定数量的参与者返回更大的标准化效应量测量值。这种方法应该直接转化为更大的复制机会(图1)。
考虑全脑关联研究设计的考虑因素。人群全脑关联研究(BWAS)旨在识别特征与大脑的结构或功能特征之间的关联。通过对BWAS进行荟萃分析,Kang等人2试图找到除样本量外,最大化标准化效应量测量值(关联强度)的BWAS设计方面,从而提高研究的可重复性。a-c,例如,Kang等人发现,在感兴趣的变量分布极端处“过度抽样”参与者的抽样方案(a)可以增加参与者间的变异性,因此在给定样本量下增加效应大小(b)和可重复性的机会(c),与均匀抽样方案相比。(改编自参考文献2的扩展数据图1和图2)](#)
纵向抽样在给定样本量下也倾向于提高平均可重复性,但有几个限制。最重要的是,在纵向和重复抽样设计中,必须分别估计参与者内效应和参与者间效应。如果未能这样做,可能会降低可重复性,因为如果参与者内变异(例如容易受到神经状态变化影响的认知指标,如睡眠)与神经成像指标的变异(如不受睡眠影响的结构测量)无关。如果适当考虑了参与者内和参与者间的变异,将重复测量在时间上更广泛地间隔可以进一步增强纵向抽样的好处。Kang等人表明,对于将衰老与大脑结构指标关联的具体案例,纵向设计的大多数好处可以通过仅两个时间点实现。
Kang等人对大量神经成像数据进行的一系列深思熟虑的分析,突出了更好的BWAS抽样策略的更广泛原则。首先,研究人员必须最大化他们感兴趣的变异。其次,他们必须最小化“干扰”变异,这种变异在生物学或临床上没有意义——例如扫描期间的头部移动。第三,他们必须知道变异的来源。它是参与者间变异还是参与者内变异?参与者内变异可能是由于日常神经状态的变化(例如困倦与休息良好)或在更长的时间尺度上的一致变化(例如随着年龄)。变异也可能源于测量误差。相对于功能指标,结构指标具有较低的测量误差,且不易受状态效应影响(如睡眠)。
在BWAS方程的非大脑方面,变量在发育或衰老效应、测量误差和易受状态变化的影响方面也存在差异。因此,最佳的BWAS设计不是一刀切的策略,仍然取决于具体情况。同样重要的是要意识到,尾部过度抽样和纵向设计并不能防止报告夸大的大脑-行为关联的风险。使用统计不足的样本进行BWAS的危险仍然存在,但对于给定的样本量,这些变异优化策略可以进一步提高复制的可能性。
继主张更大样本量的研究之后,Kang及其同事的这项令人印象深刻的工作是使BWAS更具可重复性的关键方法步骤之一。BWAS共识最佳实践的道路上仍然缺失其他里程碑。Kang等人为更复杂的抽样方案(尾部过度抽样和纵向抽样)提供了有力的证据,但这些方案可能会增加每个参与者的成本。例如,过度抽样尾部需要预先了解底层分布的知识,在某些情况下,这需要在一个更大的样本中测量非大脑变量,以便稍后进行次级抽样。因此,需要估算不同抽样方案和其他研究参数的财政权衡,以定义每单位资金获得可重复发现的最佳机会的BWAS设计。
在使用针对性的BWAS抽样方案时,另一个关键考虑是无意中放大或诱导未调查变量之间的混淆相关性。例如,当研究体重与大脑之间的关联时,过度抽样极端尾部可能会引入饮食失调作为主要混杂因素。如果某些大脑关联是非线性的——例如关系是U形的,那么抽样分布的中心可能会适得其反。因此,研究人员需要识别所有可能作为混杂因素的强大大脑关联变量,如果它们不作为抽样方案的一部分被追踪。
神经成像联盟的大型研究和大型荟萃分析样本已被证明极其有价值,如果GWAS有任何迹象,它们将继续增长。试图同时代表多个变量的基础人群进行代表性抽样的大型研究有许多优势。它们可以被许多研究人员用来调查可以使用BWAS回答的各种问题,包括那些在研究构思时未曾想到的问题。因此,在为特定问题工程化BWAS样本与更适用于探索性科学的通用用例之间存在权衡。
对于BWAS的发展和衰老、疾病进展以及研究偶发性疾病(如抑郁症),推荐使用纵向设计。尾部过度抽样似乎最适合临床队列的BWAS,尤其是当关键的非大脑指标已经可用时。尽管一些人可能会怀疑更复杂的抽样方案是否类似于P值操纵(为了虚假地达到统计显著性而进行的操纵)或其他夸大报告效应大小的可疑研究实践,但如果正确应用,Kang及其同事描述的发现可以做相反的事情。它们使研究人员能够理解实验设计的不同方面对真实信号的贡献。
Kang等人正在为特殊BWAS样本(纵向和临床队列)打开大门,但与患者合作和重复扫描的额外成本可能会使预算超出标准资助者启动的资金范围。因此,团队合作似乎是生成足够的BWAS样本的要求。对于那些还没有加入BWAS团队的研究人员来说,小样本中的精密映射也已经证明非常有成果11,15–18。
至于小样本BWAS,研究人员不应该陷入人类认知偏见,认为小样本比实际情况更有代表性。相反,他们必须听从心理学家Amos Tversky和Daniel Kahneman的忠告,他们在1971年告诫科学家19接受有时“除非样本量增加,否则根本没有运行研究的意义”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-28 11:42
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社