CurvatureFlow的个人博客分享 http://blog.sciencenet.cn/u/CurvatureFlow

博文

体视放大镜——医学图像中的最优传输 精选

已有 11406 次阅读 2018-12-5 14:25 |个人分类:老顾谈几何|系统分类:科研笔记

最近很多读者和老顾联系,大家都对深度学习的几何观点有兴趣,询问最优传输理论的自学方法。恰巧老顾的合作者最近有一篇论文将三维的最优传输映射用于医学图像,获得了中国计算机图形学大会2018的最佳论文奖【1】。这篇文章的算法可以直接用于理解最优传输理论。


体视放大镜

现代医学技术日益倚重医学图像,通过CT、MRI、PET等现代手段,人们可以获取各种医学图像,窥探人体内部器官,观察心脏脉动,药物扩散等等。通常,CT断层得到一张2维图像,多张CT图像合成一幅3维实体图像,再加上时间,我们可以得到4维图像。每个体素的灰度值代表了机体相应位置的密度。


01-右侧膝盖和左侧胫骨的局部放大.jpg

Fig 1. 右侧膝盖和左侧胫骨的局部放大。


传统的光学放大镜可以放大或者缩小二维图片,对于3维实体或者更高维图像目前不存在相应的光学设备。我们可以采用数字放大镜,将感兴趣的空间区域放大或者缩小。如图1所示,我们用CT设备得到3维图像,左帧用体渲染(volume rendering)方法显示左右腿的膝盖和胫骨,右帧放大了左胫骨和右膝盖。图2显示的是同一种数据,只是改变了视角。图3 是另外一组脊椎和胸廓数据,我们将脊椎放大了8倍。这种体视放大镜允许医生从各个角度观察医学图像,也可以得到断层,详细检查,具有一定的实用价值。

02-右侧膝盖和左侧胫骨的局部放大.jpg


Fig 2. 右侧膝盖和左侧胫骨的局部放大。


03-脊椎体数据的放缩.jpg

Fig 3. 脊椎体数据的放缩。



概率描述

体视放大镜的几何原理如下:首先,3维体医学图像被放置在单位立方体内,每个体素(voxel)上有相应的灰度值或者伪彩色。用户选取单位立方体内的子区域,我们找到一种映射,将子区域膨胀,其他区域收缩,从而达到体视放大镜的效果。更进一步的描述如下:我们记04-概率标题下1段中1公式.png为单位立方体,欧氏勒贝格测度(即体积元)为05-概率标题下1段中2公式.png,即密度函数恒为1,记成06-概率标题下1段中3公式.png。显然,单位立方体的总测度(体积)为1。用户随便指定另外一个概率测度,其密度函数为图片.png,总测度也是1,即

07-公式1.png

我们力图找到一个单位立方体到自身的光滑映射08-概率标题下2段中1公式.png,将空间变形,有的地方膨胀,有的地方收缩,从而引发密度的变化。膨胀的地方得到稀释,密度减小;收缩的地方得到浓缩,密度增加。我们希望稀释浓缩之后,密度函数从09-概率标题下2段中2公式.png变成了10-概率标题下2段中3公式.png


我们下面考虑这样的映射11-概率标题下3段中1公式.png应该满足的偏微分方程。我们将定义域的参数选取为12-概率标题下3段中2公式.png,值域的参数选取为13-概率标题下3段中3公式.png,映射记为14-概率标题下3段中4公式.png。映射将16-概率标题下3段中6公式.png处的体元15-概率标题下3段中5公式.png映射成16-概率标题下3段中6公式.png处的体元17-概率标题下3段中7公式.png。两个体元的比值,由映射雅克比矩阵(Jacobian Matrix)的行列式给出:

19-公式2.png,

这里雅克比矩阵为:

20-公式3.png

我们的目的是将概率测度21-符号1-矩阵下.png变成概率测度22-符号2-矩阵下.png,这意味着:

26-最优传播下-1公式.png,

代入以上各式,我们得到著名的雅克比方程(Jacobi Equation)

24-公式5.png.

我们考察一个特例,令源概率测度21-符号1-矩阵下.png和目标测度22-符号2-矩阵下.png都是标准的勒贝格测度,即密度函数恒为1,那么雅克比方程的解代表保持体积不变的自映射。这种自映射依然有无穷多个,构成一个无穷维的李群,我们称之为单位立方体的特殊微分同胚群 (Special Diffeomorphism Group),记为25-段落公式.jpg


最优传输

一般而言,满足雅克比方程的解有无穷多个,我们从中择优录取,挑选标准是极小化所谓的传输代价(Transportation Cost),

26-最优传播下-1公式.png.

我们在所有满足雅克比方程的映射中,寻找传输代价最小者,即所谓的最优传输映射(Optimal Mass Transportation Map)。


Brenier理论表明,如果源概率测度21-符号1-矩阵下.png满足一些非常宽泛的条件,例如绝对连续,二阶矩有限,那么最优传输映射存在并且唯一,更为奇妙的是最优传输映射是某个凸函数的梯度映射,这个凸函数被称为是Brenier势能 图片.png。所谓函数是凸的,就是说函数的海森矩阵(Hessian matrix) 

26-最优传播下-2公式.png.

是正定的(positive definite)。Brenier势能函数的梯度映射为28-最优传输矩阵下1段1公式.png,将点29-最优传输矩阵下1段2公式.png映成30-最优传输矩阵下1段3公式.png。那么,梯度映射应该满足雅克比方程,由此,我们得到著名的蒙日-安培方程(Monge-Ampere equation),

31-最优传播下-3公式.jpg

最优传输映射32-最优传播倒数第3段公式.jpg


至此,体视放大镜的实现等价于求解蒙日-安培方程,从而得到最优传输映射。蒙日-安培方程本身是高度非线性方程,其求解本身需要复杂的计算过程。


根据Brenier极分解定理,所有满足雅克比方程的解都可以分解成一个最优传输映射和一个特殊微分同胚的复合,即33-最优传播倒数第1段公式1.jpg34-最优传播倒数第1段公式2.jpg


计算几何

蒙日-安培方程最为直观的计算方法来自凸几何,并且所有的步骤都可以用经典的计算几何方法。


假设01-计算下1段1公式.png是欧氏空间的子集,我们说它是一个凸集 (convex set),如果对于其内部的任意两点02-计算下1段2公式.png,连接它们的线段也属于03-计算下1段1符号.png。给定欧氏空间的离散点集,04-计算下1段3公式.png,其凸包(convex hull)是包含点集05-包含P的所有凸集.png的最小凸集,换句话说就是包含05-包含P的所有凸集.png的所有凸集的交集就是凸包,记为06-记为CP.png。图4显示了三维空间中一些离散点的凸包。

06-三维空间中的凸包.jpg

Fig. 4 三维空间中的凸包。


凸包的计算方法非常成熟,最为普遍的是incremental 算法。比如,我们构造离散点集在三维空间中的凸包,如图4所示。首先,我们任选4个点,构造一个四面体。然后,我们每次增加一个点,逐渐更新凸包。更新方法如下:我们从新加的点处观察当前的凸包,去除凸包上所有能够看得到的面(visible facet),留下所有无法看到的面(invisible facet)。将凸包轮廓线上的每条边和新增加点相连,如此得到更新的凸包。如此重复,直至穷尽所有离散点。


给定07-凸包下2段公式1.png维欧氏空间08-凸包下2段公式2.png中的一张超平面(hyper-plane),

09-凸包下公式1.png

超平面的对偶点为

10-凸包下公式2.png

超平面将11-凸包下公式2+3中间段落公式.png维欧氏空间分成两个半空间(half space),上半空间和下半空间。上半空间定义为高于平面之上的点集:

12-凸包下公式3.png

下半空间类似定义。给定欧氏空间中的一种超平面13-凸包下公式3下段落公式1.png,这族超平面的上包络(upper envelope)定义成所有超平面对应的上半空间的交集,

14-凸包下公式4.png 。

超平面族15-凸包下公式4下符号1.png的对偶点集为

16-凸包下公式5.png,

那么上包络图片.png和凸包图片.png相互勒让德对偶 (legendre dual)


所谓的勒让德对偶定义如下:给定函数图片.png,其对偶定义为

图片.png.

如果我们将上包络图片.png视为函数图片.png的图(graph),则凸包图片.png图片.png的图。我们可以通过计算凸包来计算上包络


上包络图片.png图片.png的投影得到图片.pngPower Diagram,凸包图片.png图片.png的投影得到图片.png的 Weighted Delaunay三角剖分。Power Diagram 和 Weighted Delaunay triangulation彼此相差一个庞加莱对偶。Power Diagram的每个n维胞腔对应着Weighted Delaunay的一个顶点,如果Diagram中的两个n维胞腔共同分享一个(n-1)维的胞腔,则它们在Weighted Delaunay中对偶的两个顶点彼此相连。这意味着Weighted Delaunay中的每条边对偶着Power Diagram中的一个(n-1)维胞腔。


微信图片_20181205135026.jpg

Fig. 5 上包络、凸包、Power Digram、Weighted Delaunay 三角剖分。


图5显示了这4个概念,和它们之间的对偶关系。从计算角度而言,只要能够计算凸包,就可以计算这4个概念。


半离散最优传输

我们下面考虑最优传输的特殊情形,半离散最优传输(Semi Discrete Optimal Transportation)。给定欧氏空间中的凸区域图片.png,源概率密度函数图片.png恒等于1,目标概率测度为离散测度图片.png图片.png狄拉克函数,即质量集中在离散点上。根据Brenier定理,存在一个凸函数(Brenier势能),图片.png,其梯度映射就是最优传输映射,

图片.png

奇妙的是,Brenier定理对于离散测度依然成立,这里Brenier势能函数为分片线性凸函数,其梯度为离散点集图片.png,由此我们有离散Brenier势能

图片.png,

即Brenier势能函数的图(graph)等价于平面族图片.png的上包络。上包络向图片.png的投影得到Power Diagram,支撑平面图片.png的投影为胞腔图片.png。Brenier势能函数的梯度映射将每个图片.png图片.png的交集映射到图片.png图片.png图片.png图片.png交集的体积为图片.png。我们通过调节每个超平面的截距图片.png,使得每个胞腔的体积等于相应像点的目标测度,图片.png,那么Brenier势能函数的梯度映射给出了最优传输映射。


4.jpg

Fig.6 亚历山大定理。


由此,问题归结为如何调节截距,使得Power Diagram的胞腔体积等于目标测度。根据Brenier定理,Brenier势能函数存在,并且彼此相差一个常数,最优传输映射唯一。这一结论等价于经典的Alexandrov定理如图6所示,给定凸多面体每个面的法向量和每个面的投影面积,则凸多面体存在,并且彼此相差一个铅直平移。


我们在【2】中给出了一个基于变分的算法来构造上包络,通过优化下列凸能量,我们能够得到截距,从而得到最优传输映射,

亚历山大定理下1.jpg.

这个能量的梯度为图片.png。海森矩阵也可以直接构造,Power Diagram中的每个(n-1)维胞腔的体积除以对应的Weighted Delaunay三角剖分中对应的边长,给出了海森矩阵的元素。由此,我们可以用牛顿法直接优化这个能量,得到最优传输映射。


这里,我们用离散概率测度来逼近目标概率测度,从而用离散的上包络来逼近连续Briener势能函数。如果目标概率测度的采样距离为图片.png,汪徐家教授的理论工作【3】表明离散和连续的Briener势能函数之差的图片.png模为图片.png,最优传输映射的误差为图片.png

小结

这里的计算框架对于任意维都成立,理论上可以用于深度学习的生成模型,实践中需要克服维数诅咒(dimension curse)。最优传输理论本身博大精深,我们这里只是从几何角度讲述最为直观的内容,侧重于计算方法。Kontarovich理论更加广泛,目前在深度学习中普遍使用,但是其结构不如Brenier理论丰富,目前收敛阶的理论分析匮乏。


这篇体视放大镜是几位教授在石溪访问期间共同完成。当时大家经常在一起切磋探讨,几乎天天在推导数学、编写程序。在落叶纷飞的枫林中讨论微分拓扑中的叶状结构(foliation),在惊涛拍岸的海边辩论最优传输。夏季的长岛成为旅游胜地,人们在海边游泳嬉闹,纵情欢笑。但是来自武汉大学计算机系的苏科华教授却躺在树荫下独自苦读微分几何,令人深为感动。从这些学者身上,老顾看到了中国年轻一代孜孜以求、奋发图强的精神。相信最优传输理论会在海内外更加广泛地传播,在工程医疗方面得到更多应用。




References

                                         

  1. Kehua Su, Na Lei, Ming Ma, Li Cui, Xianfeng Gu.  "Focus + Context Visualization Based on Optimal Mass Transportation".  Best Paper Award,Chinagraph 2018.

  2. Xianfeng Gu, Feng Luo, Jian Sun, and Shing-Tung Yau. "Variational principles for minkowski type problems, discrete optimal transport", and discrete monge-ampere equations. Asian Journal of Mathematics (AJM), 20(2):383-398, 2016.

  3. Haodi Chen, Genggeng Huang and Xu-Jia Wang, “Convergence rate estimates for Aleksandrov's solution to the Monge-Ampere Equation", Accepted by SIAM J. Numerical Analysis.

  4. Na Lei,Kehua Su,Li Cui,Shing-Tung Yau,David Xianfeng Gu, "A Geometric View of Optimal Transportation and Generative Model", arXiv:1710.05488. https://arxiv.org/abs/1710.05488



https://blog.sciencenet.cn/blog-2472277-1149966.html

上一篇:VR/AR背后的弄潮儿(1):微分几何之逼近理论
下一篇:和乐群
收藏 IP: 124.16.128.*| 热度|

2 郑永军 白龙亮

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 02:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部