|
无论是基础实验还是临床研究,数据在投稿时被要求公开和分享已是大势所趋。如果论文中有必要出现研究对象的性别和年龄,即使隐去姓名和国家/地区等信息,很多医学杂志要求作者必须提供受试者的知情同意书。一般说来,医学图像文件所包含的“元数据(metadata)”,例如姓名、性别、扫描日期、以及标识号等通常在数据共享之前删除,然而,磁共振成像(MRI)扫描中的面部图像仍然可以通过简单的软件得以重建。这是一件很可怕的事情。
前天(2019年10月24日),《新英格兰医学杂志》发表了美国Mayo Clinic一组研究人员的一篇有趣短文(N Engl J Med 2019; 381: 1684-1686),让人看后觉得忧心忡忡。一些图谋不轨的人完全有可能在共享的研究数据库里获得受试者的MRI数据,再以面部识别软件将MRI的数据重建成面部图像,通过与社交网站的照片做对比从而轻而易举地找到受试者本人,这在技术上是没有难度的。可怕之处在于,其后果将导致隐私包括诊断、认知评分、遗传数据、生物标记、其他成像结果等等遭到泄露。
为了确定面部识别软件能够从头部MRI重建而得的面部图像中识别出“真人”,研究人员招募了84位在过去3个月内均接受了头部MRI的受试者,按照性别和年龄进行了分层,并拍摄了每位受试者5张角度略有变化的照片。作者对MRI以自动化系统重建面部的三维计算机模型,并为每人创建的10个具有随机光度的视角的二维照片样图像。然后,测试通过公开渠道即可获取的自动面部识别软件(Microsoft Azure),该软件试图将面部照片与用户定义的可能面部进行匹配。
将由MRI数据重建而得到的图像与每个人的5张实际照片作对比,结果令人震惊。对于84位受试者中的70位(83%),该软件将MRI重建的图像判定为受试者最可能的“真实照片”,优于其真实照片。80位(95%)受试者中,MRI图像均在前5项选择之一,亦即有一张真实的照片被排除在外。
由此看来,分享研究数据仅仅删除医学图像中的元数据不足以防止受试者隐私被不当泄露。既然公开或分享数据成为今后的大趋势,那么就有必要开发更好的电脑软件以防范不法之徒利用分享的数据重建受试者的面部照片。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 11:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社