|||
ChIP-seq是鉴定转录因子结合的一种常用技术,但存在背景信号,传统做法是用一个对照(control)数据集进行校正,去掉背景信号,但是对照也存在“bias”:一套对照可能会miss潜在的bias来源。白话就是:一个对照在A基因处ok,在B基因处也ok吗?
利用公共数据库中的大量control数据集,机器学习发挥了其优点,可以这些公共的control评估背景信号,并更加准确地识别峰。
AIControl能够(i)以高分辨率评估背景信号;(ii)以一种数据驱动的方式,系统地权衡最合适的对照数据集;(iii)捕获可能被一套对照数据集错过的潜在偏倚来源;和(iv)去掉昂贵且耗时的对照实验需求。
用一堆control来学习某位点(例如基因A)处,到底该用哪个对照。bias少了,更加准确了!
ChIP-seq也能进入到AI大数据时代了!
PS:所有优点集中在一起,最终还是优点吗?观望!
https://github.com/suinleelab/AIControl.jl
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-4 04:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社