|||
今年6月底的《新英格兰》刊出了一篇观点文章《机器学习和医学预测--远超过高期望的峰值》,文章的批判方法算是很给深度学习这个新工具留面子了。参考这篇文章:业内人的“针砭时弊”:AI医疗界的3大乱象以及如何评价医学人工智能的成果? 文中提及“ 回观国内市场,这些不靠谱、不合医学逻辑和没有临床价值的事情反而愈演愈烈,耗费了大量的资本和医疗资源,可谓几大乱象......“。
笔者认为,目前AI在医学影像方面的努力还是很值得鼓励的,只是要真正击中诊断环节中医生的痛点,还得进一步向曲径通幽处前进。
一是前文提及的“使用医学而不是计算机工程的评价体系来衡量人工智能系统是否靠谱”。用AUC(ROC曲线下面积)、Sensitivity (敏感度)、Specificity(特异度)等性能评价体系。而不是Accuracy (准确率)、Precision (精确率)。不难理解,为什么公关软文中最常出现“准确率超过95%”,“精确率超过98%”,云云。下次再读到“准确率超过95%”的时候,我们可以这么想,准确率95%可能意味着系统蒙答案的时候主要蒙A选项,然后测试样本中的A占绝对多数;那么再读到“精确率超过98%”的时候,我们可以这么想,系统的敏感度可能只有30%,在他能够报出为阳性的时候,绝大部分是对的。
二是与医学团队合作,整合生物学特征feature,或者被生物学特征整合,形成真正的集成诊断系统。实际上,在AI大热之前,科学家尝试将影像技术与基因技术有机结合,进行疾病的诊断。放射组学Radiomics的工作流程一般为:(1)获取高质量的标准图像、(2)分割出含有肿瘤等的感兴趣区域、(3)提取图像特征,如密度分布、不同密度层面的空间关系,纹理特性以及肿瘤跟周围组织的关系;(4)建模。值得注意的是,这个任务,生物学家做了很多年,如果能够将影像学特征feature,与生物学feature集成建模,形成多模态AI系统,将是一种完美的结合:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 01:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社