luria的个人博客分享 http://blog.sciencenet.cn/u/luria

博文

FitHiC V1算法解析(二)

已有 1752 次阅读 2020-3-14 14:55 |个人分类:Hi-C|系统分类:科研笔记| Fit-Hi-C, 显著互作, Hi-C, Loops, 假设检验

FitHiC V1主要用于识别中程顺式互作

本文接着上一篇博文《FitHiC V1算法解析()》继续探讨FitHiC V1的算法过程。该博文中介绍了FitHiC的整体思路,但是这种基于假设检验来检测显著互作的方法,早在2010年就已经提出来了[1],该文章与FitHiC引文的通迅作者都是大神William Stafford Noble。那么FitHiC在之前算法的基础上又有哪些新的改进呢?

FitHiC中,对上篇博文提到过的binned bionormial method,进行了两点改进:

1. 初始样条拟合(Initial spline fit)

discrete binning过程换成了equal-occupancy binning,再进行样条拟合,这样可以在某个特定的基因组距离(spline-1)上,更加精确地对连接概率(contact probability)进行评估。

1.1样条拟合

早期工程师制图时,把富有弹性的细长木条(所谓样条)用压铁固定在样点上,在其他地方让它自由弯曲,然后沿木条画下曲线,