国际科学编辑isechina的官方博客分享 http://blog.sciencenet.cn/u/isechina

博文

研究局限性有必要写在文章中吗?怎么写?

已有 2978 次阅读 2019-7-9 09:42 |个人分类:论文写作|系统分类:教学心得| 写作, 局限性, 论文

为什么要写研究局限性

论文写作中添加有关研究局限性的描写有助于增加文章的可信度。如果审稿人发现某一局限,但是作者未事先说明,审稿人可能会对论文产生负面印象。如果在未来的研究背景下讨论论文的每个局限性,即提出在未来研究中提高研究有效性的方法,你的文章更有可能被引用,因为它将为其他研究人员的研究问题提供有价值的信息。

如何识别研究局限性

你应该从两个角度思考你的研究 -内部有效性和外部有效性

内部有效性是指研究推断的强度,即你是否怀疑对所观察到的结果是由测试变量引起的?其他因素是否会影响结果?如果是,你的研究的内部有效性可能有局限性。

外部有效性是指结果可以推广到更普遍的程度。如果要在不同的环境中利用相同机制重新进行研究,例如,不同的研究对象或不同的环境中,这类研究会得到类似的结果吗?如果没有,您的研究的外部有效性可能有局限性。

不应该担心局限性

提醒一下,所有研究都以某种方式存在疑问。在这篇文章中......

我们列出了科学、技术、教育和医学领域(STEM)研究中最常见的局限性,并提供了真实的例子。但请注意,这不是一份全面的清单。此外,请注意这些限制并不相互排斥,许多可以重叠。

研究局限性的示例

Selection bias

选择偏差

当用于分析的个体、群组或数据的选择不是随机的,会发生选择偏差。

例如,假设一项研究回顾性地对比了不同外科手术的死亡风险[例1]。其中一项外科手术较其他的更新。当测试了新的外科手术后,外科医生当然选择最理想的手术。因此,研究结果会受到外科医生选择手术类型这个个体的影响,即只为其中的一个治疗组选择最理想的手术治疗。

Confounding

干扰因子

干扰因子是另一个例子,有时会被隐藏,是一个影响因变量的变量。如果一个干扰因子没有被考虑到,任何测试变量和结果的关系都不会准确。

例如,设想一项研究检验了眼球追踪测定认识性能[例2]。众所周知,认识性能随着年龄增加会减弱。因此,如果年龄不作为一个干扰因子,效应量会被低估或高估。

另一个例子,假设在研究中检验了骨关节炎和心血管事件的关联[例3]。心血管事件与很多因素有关,包括吸烟状况,腹部肥胖,心血管家族史等,这些都会干扰结果。

Survivorship bias

幸存者偏差

如果仅仅对一些经过相同选拔流程的和由于缺乏可见性没有被忽视的学科偏差作出推论,就会发生幸存者偏差。

例如,假设一项研究检验了骑车和性功能障碍之间的关联[例4]。一个人遭受性功能障碍可能是因为骑车会影响活跃。因此,如果该项研究只研究了经常骑车的人,这个人会被忽视,并构成该研究结果的偏差。

Study scope limitations

研究范围局限

不可靠或不可用的数据能限制研究范围,甚至整个结果。

例如,假设一项研究检验了不同世界地区内的热产生[例5]。研究人员没有关于家庭使用木材的数据。在一些地区,比如,发展中国家,家庭木材的使用产生了打了的热。因此,这些地区的热产生会被低估。

Sample size limitations

样本大小的局限

如果某个特殊的结果是真实发现以及类型II的错误在一些情况下可能发生,比如,虚无假设是错误的,研究小组间的差异未被报道,则样本大小可能很难确定。

例如,设想一项研究检验了血栓溶解在治疗急性心肌梗塞的功效。血栓溶解对急性心肌梗塞的的影响很重要但是很小。因此,样本量相对较小的研究可能无法揭示这一较小的影响,还可能会导致类型II的误差 [6]。

Experimenter bias

实验者偏见

当进行实验的个体对不同试验组的参与者以不同的无意识表现不经意地影响实验结果时,就是实验者偏见。

例如,设想一项研究测试了游戏玩家是否知道其与一个人或人工智能对战的能力 [例7]。服务商在参与者的背后观察着游戏对战。如果服务商意识到人工智能的本性,他们可能会无意地影响参与者。

Referral bias

转诊偏倚

转诊偏倚是指病人从一个诊所转至另一个的现象,经常是专业单位,倾向于比非就诊的病人更可靠。在包含许多转诊的研究中,风险因素可能被高估。

例如,设想一项研究在某专业转送中心评估了神经结节病的临床表现[例8]。慢性无菌性脑膜炎是最常被报道的净胜异常——37%的病例。和其他研究相比,这个频率是相对较高的。该转送中心以慢性脑膜炎专业为人熟知。因此,这种病例可能会被转送到该中心,构成转诊偏倚。

Self-reported data

自述数据

自述数据受多种偏差影响,比如,选择性记忆,夸张等,并且不能各自证实。

例如,设想一项研究在确定智能手机用户压力时,检验了输入压力的有效性 [例9]。要求参与者回想压力,并在一定范围内排序。随后检测输入压力。无论什么原因,参与者可能高估或低估压力水平,从而影响了研究结果。

Limitations of exploratory studies

探索性研究的局详性

如果对于某个存在极少或没有先前研究的主题,研究人员可能需要建立一个与研究问题和研究设计相关的基准。由于不存在基准作对比,结果的有效性受争议。

例如,设想一项探索性研究测试了电视用户使用新的远程控制器 [例10]。不是按钮,而是远程挤压或吸。直到结果可重复,否则不认为研究发现是决定性的。

Methodological limitations

方法局限性

这是指对研究中方法论的相关局限性。

例如,设想某研究测试了端粒长度用作先天性角化不良的诊断参数[例11]。该研究采用了来自两个医院的先天性角化不良病人的数据。每个医院采用自己的方法提取DNA,其中一家提取的是较短的DNA,这个局限性会影响研究结果。

另一个例子,设想某研究测试了一种新颖的技术监测结构损伤的能力,而结构损伤是很难被监测的(例如,下桥)[例12]。该研究认为新技术是有前景的,然而,其覆盖范围只有30 × 30 m,意味着该新技术只适用于短距离范围。

Systematic literature reviews

系统的文献综述

在一篇系统的文献综述中,研究人员使用定义明确的搜索技术搜索相关研究问题的文献。然而,取决于搜索标准,无法保证可以搜索到所有相关的文献。通常,灰色文献和技术报告不包括在内,系统的文献综述只包括一种语言,典型的是英语呈现的研究。

Hawthorne effect

霍桑效应

霍桑效应是指当参与者意识到自己被观察的时候表现不同的现象。

例如,设想某研究测试了恐惧诉求信息促进在线安全行为的能力[例13]。给参与者展示网络攻击的盛行和影响的详细恐惧性诉求,随后在线调查他们的行为。在4周后,再次考察参与者,看恐惧诉求的影响是否在持续,以及是否有采取行动的意向。参与者可能假装声称已经改进自己的行为试图减少因没有改变行为的羞耻,或试图使研究者满意。

Regression toward the mean

趋中回归

这是指某变量首次测试是极端的(即远不止平均水平),而第二次测试不那么极端的现象。典型地是伴随着不对称采样发生,例如,研究只采用最差或最好的。但是,它仍会偶然发生(见示例)。

例如,设想某研究检验了血细胞比容(红细胞体积占血总体积的比例)对鸟类飞行特性的影响[例14]。在先期试验中,即,在操作血细胞比容前。鸟在试验组中被认为是具有相当好的飞行特性。即使没有操作,如果反复测试,由于趋中回归,这些鸟的飞行特性也会被减弱。因此,后期测试的结果,即,操作以后,可能受到该效应的影响,并且可能不是操作真实效果的反映。

Repeated testing

重复测试

重复测试参与者可能导致偏差。先期测试可能以未曾料到的方式使参与者敏感,影响后期测试的结果。

例如,设想某研究测试了以不同眼睛测试,诊断青光眼导致的焦虑[例15]。几乎所有的参与者都进行了其中的一项测试。这可能导致低估了焦虑会随着测试的进行而增加。

Population validity

总体效度

总体效度指研究中的样本如何代表目标人群。

例如,设想某研究中目标人群都是美国的因特网用户。仅仅使用推特用户就不具有代表性,因为美国的成年推特用户更年轻,并且相对于普通大众更可能是民主党 [16]。

如何表现局限性

通常,研究局限性以过去在讨论部分的结尾给出。以开始局限性作为开始。提出围绕这个问题,是否采取任何措施。描述任何证据可能会减小局限性的影响。讨论局限性如何影响研究结果。最后,如果可用,讨论能够采取的措施在未来的研究中克服局限性。

参考文献:

  1. Stiles ZE, Behrman SW, Glazer ES, Deneve JL, Dong L, Wan JY, Dickson PV. Predictors and implications of unplanned conversion during minimally invasive hepatectomy: an analysis of the ACS-NSQIP database. HPB. 2017 Nov 1;19(11):957–65.

  2. Rosa PJ, Gamito P, Oliveira J, Morais D, Pavlovic M, Smyth O. Show me your eyes! The combined use of eye tracking and virtual reality applications for cognitive assessment. In Proceedings of the 3rd 2015 workshop on ICTs for Improving Patients Rehabilitation Research Techniques 2015 Oct 1 (pp. 135–138). ACM.

  3. Kendzerska T, Jüni P, King LK, Croxford R, Stanaitis I, Hawker GA. The longitudinal relationship between hand, hip and knee osteoarthritis and cardiovascular events: a population-based cohort study. Osteoarthr Cartilage. 2017 Nov 1;25(11):1771–80.

  4. Gaither TW, Awad MA, Murphy GP, Metzler I, Sanford T, Eisenberg ML, Sutcliffe S, Osterberg EC, Breyer BN. Cycling and female sexual and urinary function: results from a large, multinational, cross-sectional study. J Sex Med. 2018 Apr 1;15(4):510–8.

  5. Mekonnen MM, Gerbens-Leenes PW, Hoekstra AY. The consumptive water footprint of electricity and heat: a global assessment. Environ Sci-Water Res Technol. 2015;1(3):285–97.

  6. Jones SR, Carley S, Harrison M. An introduction to power and sample size estimation. Emerg Med J. 2003 Sep 1;20(5):453–8.

  7. Wehbe RR, Lank E, Nacke LE. Left Them 4 Dead: Perception of humans versus non-player character teammates in cooperative gameplay. In Proceedings of the 2017 Conference on Designing Interactive Systems 2017 Jun 10 (pp. 403–415). ACM.

  8. Leonhard SE, Fritz D, Eftimov F, van der Kooi AJ, van de Beek D, Brouwer MC. Neurosarcoidosis in a tertiary referral center: a cross-sectional cohort study. Medicine. 2016 Apr;95(14).

  9. Exposito M, Picard RW, Hernandez J. Affective keys: towards unobtrusive stress sensing of smartphone users. In Proceedings of the 20th International Conference on Human-Computer Interaction with Mobile Devices and Services Adjunct 2018 Sep 3 (pp. 139–145). ACM.

  10. Bernhaupt R, Desnos A, Pirker M, Schwaiger D. TV interaction beyond the button press. InIFIP Conference on Human-Computer Interaction 2015 Sep 14 (pp. 412–419). Springer, Cham.

  11. Gadalla SM, Khincha PP, Katki HA, Giri N, Wong JY, Spellman S, Yanovski JA, Han JC, De Vivo I, Alter BP, Savage SA. The limitations of qPCR telomere length measurement in diagnosing dyskeratosis congenita. Mol Genet Genomic Med. 2016 Jul;4(4):475–9.

  12. Kang D, Cha YJ. Autonomous UAVs for structural health monitoring using deep learning and an ultrasonic beacon system with geo‐tagging. Comput Aided Civ Inf. 2018 Oct;33(10):885–902.

  13. Jansen J, van Schaik P. The design and evaluation of a theory-based intervention to promote security behaviour against phishing. Int J Hum Comput Stud. 2019 Mar 1;123:40–55.

  14. Yap KN, Dick MF, Guglielmo CG, Williams TD. Effects of experimental manipulation of hematocrit on avian flight performance in high-and low-altitude conditions. J Exp Biol. 2018 Nov 15;221(22):jeb191056.

  15. Chew SS, Kerr NM, Wong AB, Craig JP, Chou CY, Danesh-Meyer HV. Anxiety in visual field testing. Br J Ophthalmol. 2016 Aug 1;100(8):1128–33.

  16. Pew Research Center. Sizing Up Twitter Users. 2019 Apr 24. Available from:https://www.pewinternet.org/2019/04/24/sizing-up-twitter-users/ [Accessed 6 June 2019].

  17. https://www.internationalscienceediting.com/how-to-suggest-reviewers/





http://blog.sciencenet.cn/blog-3387871-1188705.html

上一篇:Highwire Analytics--快速洞察数据驱动,基于证据的编辑和业务决策
下一篇:作者大观察:论文作者独行侠的日子屈指可数了吗?

3 孙学军 黄永义 王从彦

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-7-21 04:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部