||
(一)数学猜想
假设存在两个数列,即数列1和数列2,两个数列之间以及每个数列的内部数字之间均无相同的数字。
数列1:{a1、a2、a3……an}
数列2:{b1、b2、b3……bm}
将每个数列内部的数字按从小到大的顺序排列,计算两个相邻数字之间的差值,然后统计每个差值的频次。
猜想:如果数列1中相邻两个数字之间的差值与该差值的频次满足,其中x代表相邻数字之间的差值,y代表该差值的频次;数列2中相邻两个数字之间的差值与该差值的频次满足,则,如果将两个数列组成一个数列,将其命名为数列3,同时将数列里的数字按从小到大的顺序排列,那么,数列3中相邻两个数字之间的差值与该差值的频次满足。
不知这个猜想能否证明,是否正确?感兴趣的朋友可以去证明一下,如果能将结果告知,本人将万分感谢!
(二)该猜想来源的背景介绍
4-甲基胞嘧啶:是一种在胞嘧啶4'碳位共价结合一个甲基基团的化学修饰类型,在原核生物基因组DNA中普遍存在。
供试菌株:硫还原地杆菌(Geobacter sulfurreducens PCA)
处理条件:三种不同的电子受体培养环境,其中,柠檬酸铁为水可溶性电子受体,水铁矿为水难溶性电子受体,延胡索酸为非金属电子受体。
结果显示:三种培养环境条件下,4-甲基胞嘧啶(4-methylcytosine, m4C)的基因组甲基化修饰模式不同,其中,柠檬酸铁作为电子受体时,正链有73242个甲基化位点,负链有78089个甲基化位点,合计151331个甲基化位点;水铁矿作为电子受体时,正链有160734个甲基化位点,负链有174832个甲基化位点,合计335566个甲基化位点;延胡索酸作为电子受体时,正链有113317个甲基化位点,负链有123992个甲基化位点,合计237309个甲基化位点。
(三)问题
4-甲基胞嘧啶在基因组中具有什么样的分布规律?三种环境下,如此大的修饰差异意味着什么?
(四)计算方法
从起始子开始,按照4-甲基胞嘧啶在基因组中的位置进行编号,计算两个相邻修饰位点之间的差值,统计每个差值的频次,分析差值与其频次之间的关系(如下图所示)。
红色标记的“C”表示被修饰的胞嘧啶,即4-甲基胞嘧啶,则在这11个碱基的DNA中,
正链:差值为10—2=8,差值的频次为1;
负链:差值为8—4=4,差值的频次为1;
按两条链算:差值为4—2=2、8—4=4、10—8=2,差值2的频次为2,4的频次为1;
(五)研究结果
结果发现,4-甲基胞嘧啶在一种细菌基因组DNA中(细菌只有一条DNA)的分布服从幂函数规律,即,其中a为回归系数,b为指数系数,x代表差值,y代表差值的频次。
有意思的是,4-甲基胞嘧啶不但是按双链计算,还是按正链或负链计算,差值与差值的频次均服从幂函数规律;
更有意思的是,在这三种4-甲基胞嘧啶数量彼此之间有数万差异的样品中,差值与差值的频次均服从幂函数规律;
更更有意思的是,按照DNA双链计算获取的幂函数中的回归系数是分别从正、负链中计算获取的幂函数的回归系数的和,指数系数是分别从正、负链中计算获取的幂函数的指数系数的平均值(如下图所示)。
(六)研究意义
正如运动会开幕式中的广播体操表演,每个人的表演是一种艺术,除此之外,集体的变化也是一种艺术,DNA的甲基化修饰会不会也是如此,特定位置的修饰可能有特定的功能,此外,修饰位点在整个基因组中的分布特征可能也是一种信号,也具有一定的生物功能。
文章来源:
Shi Z, Yu Z, Chen W: 4-Methylcytosine distribution follows the power function in Geobacter sulfurreducens genome. Biochemical and biophysical research communications 2021, 547:65-68.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 02:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社