|
贺飞 | (北京大学)
本文2019年4月7日首发于里瑟奇智库公众号,参见:https://mp.weixin.qq.com/s/DEd1J1tm8RQQwXwKQgc4bQ
The rise of powerful AI will be either the best or the worst thing ever to happen to humanity. We do not yet know which.(强大的人工智能的崛起将是人类有史以来最好或最坏的事情。我们还不知道是哪一个)。----Stephen Hawking
自1990年代初以来,简单的神经网络已被用于医学中,以解释心电图、诊断心肌梗塞、并预测心脏手术后重症监护病房的住院时间等。近年来,人工智能的医学应用激增,如机器人、医学诊断、疾病预测、图像分析(放射学、组织学),文本识别与自然语言处理、药物活性设计和基因突变表达预测、健康管理、医学统计学和人类生物学、治疗效果和预后预测以及近年来快速发展的组学技术等。2000年,美国食品药品监督管理局(FDA)批准美国公司Intuitive Surgical生产的达芬奇外科手术系统上市。这种微创手术系统可以用于泌尿外科、心脏瓣膜修复和妇科等复杂手术。这一系统目前在世界各地已超过5000台投入运行。一种独特的新型精准药物输送纳米机器人也得到广泛使用。 人工智能提高了学习能力,提供了规模化的决策支持系统,正在改变医疗保健的未来。虽然人工智能可以在许多方面帮助医生,但在可预见的未来它不太可能取代医生。让我们看看人工智能在医学中的新用途。 生物医学大数据 当前的生物医学大数据,由电子医疗记录和数字图像存档(每幅图像约20MB)积累而成,以每年1.2至2.4 exabytes的速度增长到了惊人的100至250 exabytes。然而,这一生物医学大数据仍然非常零碎和无序。截止目前,传统的“自上而下”数据需要医疗保健数据库或登记处(包括手动输入数据及其固有的准确性和完整性限制,然后使用相对基本的统计工具进行数据分析)。 近年来,这种新的大数据范式主要以基因组医学及其不断升级的基因转录大数据的形式成功地应用于生物医学科学。这种基因大数据的巨大规模和快速获取是绝对令人眩晕的。尽管面临着艰巨的挑战,但也有一些人已经迎接了这一挑战,并成功地迈向了对患者护理的积极影响。基因组医学的整个数据转换工作的顶峰是ENCyclopedia Of DNA Elements (ENCODE project),这是由国家人类基因组研究所资助的研究小组的国际合作,旨在描绘人类基因组中编码的功能元素的整体。 电子病历 电子病历(EMR)记录和共享医疗信息的有效工具。但随着时间的推移和设备的升级换代,电子病历缺乏跨技术平台的互操作性,其结构化和非结构化数据难以大规模扩展兼容。集成专门为管理数据集设计的基于机器学习的建模,可以帮助检测潜在的并发症,提高医疗资源的利用率和个性化水平的结果。利用自然语言处理这一人工智能工具,可以阅读并联系上下文处理电子病历,以用户友好的方式准确地编译和连接数十年积累的各种电子病历数据数据(历史、物理、实验室、成像、药物等)。例如,IBM开发的Watson能在几秒钟内从不同的电子病历,生成准确的通用问题列表,同时根据临床查询编译相关的医学文献。此外,电子病历数据记忆的深度学习模型可用来预测未来的疾病轨迹和医疗结果。利用机器学习应用于电子病历数据已证明可预测脓毒症患者的结果。一项基于机器学习的大型死亡率研究,根据超声心动图结合电子病历数据预测患者生存率的准确性达到96%。 疾病预测、诊断和慢病管理 应用人工智能可以在许多情况下实现疾病的早期诊断。人工智能在医疗卫生中的应用研究主要集中在癌症、神经系统和心血管疾病方面,因为这些疾病是导致残疾和死亡的主要原因。在传染性和慢性疾病(如II型糖尿病、炎性肠病、Clostridium difficile菌感染等)也受到了相当大的关注。例如,美国食品药品监督管理局(FDA)允许应用诊断软件,以检测成人患者手腕骨折。在另一项对1634张癌性和健康肺组织的图像研究中,该算法与3名病理学家一样,准确地将2种常见类型的肺癌与健康情况区分开。通过图像热图模式识别,预测重度抑郁症的准确率已达74%。虽然噪声数据和实验限制降低了模型的临床实用性,但是深度学习方法可以通过分层自动编码分析减少数据的维数来解决这些限制。在一项分析308个皮肤组织病理学的1400多个图像实验中,检测基底细胞癌并区分良恶性病变,与专家相比,诊断准确率达到90%以上。 基因芯片被广泛用于检测癌细胞基因的表达。然而,尽管芯片具有20000-50000个遗传特征的诊断探针,但噪声数据和实验限制降低了它们的临床应用。深度学习通过减少数据多样性(维度)和应用分层自动编码分析,训练人工神经网络来实现更精确的癌症检测和分类来解决这一问题。例如,采用深度学习架构视觉模式,分析1417张皮肤图像的组织病理学,检测基底细胞癌并区分恶性和良性病变,优于先前的自动化分析,与专家相比诊断准确率>90%。深度学习组织病理学识别非淋巴结活检中的转移性乳腺癌,具有与专家相似的肿瘤检测和定位的诊断准确性。这些系统通过比较数百万个肿瘤阳性和阴性组织学斑块的特征进行训练,使用热图对这些数据进行后处理以预测肿瘤的概率。将病理学家和深度学习相结合,优化性能,减少85%的人为错误率。使用卷积神经网络多层次算法对2032例恶性和良性皮肤病的129450张图像进行分类,这些算法经过训练可识别常见的致命性皮肤癌,其角质形成细胞癌与黑色素瘤的检测能力,已经超过了21位皮肤科医生。 人工智能技术已应用于心血管医学,以探索现有疾病的新基因型和表型,提高患者护理质量,提高成本效益,降低再入院率和死亡率。在过去的十年里,一些机器学习技术已经被用于心血管疾病的诊断和预测。每一个问题都需要对这个问题有一定程度的了解,从心血管医学和统计学的角度来应用最优的机器学习算法。在不久的将来,人工智能将导致向精准心血管医学的范式转变。 人工智能还可以优化慢性病患者的护理轨迹,为复杂疾病提供精确的治疗建议,减少医疗差错。人工智能分析可用于慢性疾病管理,其特点是多器官参与、急性可变事件和长期疾病进展延迟。例如,视网膜病变可以通过机器学习来预测。使用深度学习来检测和分级糖尿病视网膜病变和黄斑水肿,在眼科医生对每幅图像进行3到7次分级后,对检测中度严重视网膜病变和黄斑水肿具有很高的特异性和敏感性。 药物发现 由于药物开发成本高、可指导药物靶点特征化的三维结构信息的可用性增加、临床试验的成功率极低,机器学习现在被用于药物发现过程中。机器学习可作为实现跨域链接的桥梁。它可以通过识别上下文线索(如对其适应症或副作用的讨论)来识别新批准的药物。总的来说,人工智能在应用于现有资源时已经取得了成功,包括利用药物信息,通过在所有疾病中应用相似性指标等技术来寻找共享途径,从而获得对作用机制的洞察。另一个例子是使用自然语言处理来识别隐藏的或新关联,检测潜在药物不良反应。 临床试验设计 使用机器学习方法,通过建立临床试验研究和医院数据库中的生物系统模型,描述了肿瘤药物开发中使用的数值方法,为预测性、预防性、个性化和参与性医学铺平了道路。这种方法使搜索者能够在临床试验中部分替换动物或人类,并生成具有特定特征的虚拟患者,以增强此类研究的结果。这些方法尤其有助于儿科或孤儿病的试验,并可应用于从临床前阶段到上市后阶段的药代动力学和药效学。在一项研究中,研究人员在该研究中使用虚拟疗法对克罗恩病的抽搐患者合成物进行治疗。结果表明,初始疾病活动评分与疾病活动评分下降呈正相关,但不同药物的疗效不同。在临床试验中,在生物医学产品的设计和发现阶段、生物标志物识别、剂量优化或拟议干预的持续时间方面,可能具有相当大的潜力。 疫情预测 已知概率人群之间的传染病分布模式基于对环境生态和生物学特征的先验知识。如果模型参数部分已知,则可以早期预测流行病(如感染高峰和持续时间)。一个例子是谷歌追踪流感流行(称为“流感趋势”),并在流行病学研究中使用大型数据集进行了进一步完善。新的Hadoop数据库技术将数据处理的提取-转换-负载(或ETL)循环最小化,从而有助于实时收集和分析大数据。另一项研究,成功预测了乌干达西部、西南部和中部可能爆发丝状病毒的地区。此外,通过对埃及伊蚊幼虫雌蚊感染率的估算,确定了泰国中部地区登革热出血热的发病率,并在训练和试验中分别达到了95%和88%的预测准确率。 治疗效果及预后预测 治疗效果和结果预测也是疾病管理策略和个性化护理计划中具有潜在临床意义的重要领域。十年前,只有分子和临床信息被用来预测癌症的结局。随着高通量技术的发展,包括基因组、蛋白质组学和成像技术,新的输入参数被收集并用于预测。由于样本量大,多模式数据类型完整,包括组织学或病理学评估,这些方法可以显著提高癌症易感性(15%-25%)、结果预测和预后的准确性。 例如,为了改善充血性心力衰竭患者的护理,一项研究使用了监督机器学习法,对397例射血分数维持的心力衰竭患者的46个临床变量进行了研究。表型热图比常用的风险评估工具更准确地预测患者的生存率。精准药物治疗癌症的目标之一是根据单个患者肿瘤的基因组数据准确预测最佳药物治疗。在一项研究中,研究人员提出了一种开放访问算法,用于预测癌症对7种常用化疗药物的反应。精准药物的成功取决于算法能够将大量的组学数据转化为临床可操作的预测。人工智能可能有用的另一个领域是监测引导药物输送到靶器官、组织或肿瘤。例如,纳米机器人可以克服治疗剂难以扩散到感兴趣靶点的输送问题。 病人护理 人工智能可以根据症状帮助患者分类。例如,数字医疗公司HealthTap开发了“Dr.A.I.”,该公司根据过去的病史和从经验丰富的医生那里提取的知识进行操作,并要求患者指定症状,以便分诊他们是否应该去急诊室、急诊室或初级保健医生。在不久的将来,人体对血糖、红细胞压积、血氧饱和度、糖化血红蛋白、血脂、感染和炎症生物标志物的检测也将被整合到人工智能技术中。此外,人工智能可以通过减少处理时间来促进医生和患者之间的沟通,从而提高患者的护理质量。 人工智能在医学中另一种应用是使用机器人作为帮手;例如,日本的Carebots机器人为认知能力下降或行动能力有限的老年人提供陪护。机器人在外科手术中被用作助理外科医生,甚至独立主刀。此外,机器人还能与自闭症儿童交流并提供教育。 精准健康 基因和生物医学研究继续进行调查,目的是揭示基因与人类特征或疾病之间的联系。许多研究依赖于大规模的敏感基因型或表型数据,跨机构的共享对于此类研究的成功至关重要。例如,在最近一项样本量有限的病例对照研究中,研究人员开发了一种整合个人全基因组测序和电子病历数据的算法,并将该算法用于腹主动脉瘤的研究。他们根据个人基因组基线评估了修改个人生活方式的有效性,证明了该模型作为个人健康管理模型的实用性。这些研究有可能揭示其他复杂疾病的生物学结构。 潜在危险 数据科学所带来的伦理挑战也是一个争论的领域。这些挑战可以在概念空间内映射,并由3个研究分支来描述:数据和隐私伦理、算法伦理和道德以及实践伦理和价值观。其中,隐私一直是关注的中心。人工智能并不是专门为医疗保健开发的工具。虽然人工智能已经准备好解决医学实践中的“痛点“,但技术进步需要收集和共享大量数据,从而产生对隐私的担忧,即数据的所有权和信息的保密性可能导致对患者的识别(尤其是通过一个称为三角测量的过程)。机器学习在精准医学的发展中起着关键的作用,根据患者的临床或遗传风险因素进行治疗。这些进步需要收集和共享大量数据,从而产生对隐私的关注。在这种情况下,需要建立一个隐私保护框架,并应适用于研究参与者和机构的隐私和保密性属于关注点。 人工智能不同于传统的计算机算法,它能够根据积累的经验进行自我训练。这种独特的功能使人工智能能够在相同的情况下,根据先前执行的操作,采取不同的行动。这种积累经验并从中吸取教训的能力,以及独立行动和做出个人决定的能力,为损害创造了先决条件。这意味着人工智能在其行为中可能因某种原因造成损害。但现行法律都不承认人工智能是一个法律主体,这意味着人工智能对其造成的损害不承担个人责任。那么谁对人工智能的行为造成的损害负责呢?因此,人工智能的发展及其不断增长的实际应用,需要法律法规框架的变化。 虽然人工智能可以在许多方面帮助医生,但在可预见的未来它不太可能取代医生。在预测分析和图像识别方面,人工智能可能很快会比医生更有效,因为医生无法在任何合理的时间段内处理数百万图像。尽管如此,由于人工智能的局限性,它还不能取代床边的医生。首先,人工智能不能与患者进行高层对话或互动,以获得他们的信任、安抚他们或表达同理心,这是医患关系的所有重要组成部分。其次,人工智能传感器可以收集有价值的信息(如体积状态或炎性细胞因子),以帮助诊断,但仍然需要医生进行传统的身体检查,特别是在需要高水平互动和批判性思维的神经学领域。第三,尽管人工智能可能达到可以进行实时CT扫描或其他物理扫描以检测疾病的程度,但仍需要医生在不明确的情况下进行解释,以整合病史、进行物理检查并促进进一步讨论。 参考文献 1.A. M. Turing, Mind 59, 433 (1950). 2.https://doi.org/10.1016/j.amjmed.2019.01.017. 3.https://doi.org/10.1016/j.ejim.2017.06.017. 4.https://doi.org/10.1016/j.metabol.2017.01.011 5.https://doi.org/10.1016/j.clsr.2015.03.008 6.https://doi.org/10.1016/j.clsr.2016.05.003 7.https://doi.org/10.1016/j.amjmed.2017.10.035 8.https://doi.org/10.1016/j.ppedcard.2016.08.021
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-12 15:51
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社