dream0711的个人博客分享 http://blog.sciencenet.cn/u/dream0711

博文

一个亟待证明的数学猜想及其可能暗藏的生物密码

已有 1669 次阅读 2021-6-11 10:30 |个人分类:论文交流|系统分类:论文交流

(一)数学猜想

假设存在两个数列,即数列1和数列2,两个数列之间以及每个数列的内部数字之间均无相同的数字。

数列1{a1a2a3……an}

数列2{b1b2b3……bm}

将每个数列内部的数字按从小到大的顺序排列,计算两个相邻数字之间的差值,然后统计每个差值的频次。

猜想:如果数列1中相邻两个数字之间的差值与该差值的频次满足image.png,其中x代表相邻数字之间的差值,y代表该差值的频次;数列2中相邻两个数字之间的差值与该差值的频次满足image.pngimage.png,则,如果将两个数列组成一个数列,将其命名为数列3,同时将数列里的数字按从小到大的顺序排列,那么,数列3中相邻两个数字之间的差值与该差值的频次满足image.png

不知这个猜想能否证明,是否正确?感兴趣的朋友可以去证明一下,如果能将结果告知,本人将万分感谢!

(二)该猜想来源的背景介绍

4-甲基胞嘧啶:是一种在胞嘧啶4'碳位共价结合一个甲基基团的化学修饰类型,在原核生物基因组DNA中普遍存在。

供试菌株:硫还原地杆菌(Geobacter sulfurreducens PCA

处理条件:三种不同的电子受体培养环境,其中,柠檬酸铁为水可溶性电子受体,水铁矿为水难溶性电子受体,延胡索酸为非金属电子受体。

结果显示:三种培养环境条件下,4-甲基胞嘧啶(4-methylcytosine, m4C)的基因组甲基化修饰模式不同,其中,柠檬酸铁作为电子受体时,正链有73242个甲基化位点,负链有78089个甲基化位点,合计151331个甲基化位点;水铁矿作为电子受体时,正链有160734个甲基化位点,负链有174832个甲基化位点,合计335566个甲基化位点;延胡索酸作为电子受体时,正链有113317个甲基化位点,负链有123992个甲基化位点,合计237309个甲基化位点。

(三)问题

4-甲基胞嘧啶在基因组中具有什么样的分布规律?三种环境下,如此大的修饰差异意味着什么?

(四)计算方法

从起始子开始,按照4-甲基胞嘧啶在基因组中的位置进行编号,计算两个相邻修饰位点之间的差值,统计每个差值的频次,分析差值与其频次之间的关系(如下图所示)。

image.png

红色标记的“C”表示被修饰的胞嘧啶,即4-甲基胞嘧啶,则在这11个碱基的DNA中,

正链:差值为102=8,差值的频次为1

负链:差值为84=4,差值的频次为1

按两条链算:差值为42=284=4108=2,差值2的频次为24的频次为1

(五)研究结果

结果发现,4-甲基胞嘧啶在一种细菌基因组DNA中(细菌只有一条DNA)的分布服从幂函数规律,即image.png,其中a为回归系数,b为指数系数,x代表差值,y代表差值的频次。

image.png

有意思的是,4-甲基胞嘧啶不但是按双链计算,还是按正链或负链计算,差值与差值的频次均服从幂函数规律;

更有意思的是,在这三种4-甲基胞嘧啶数量彼此之间有数万差异的样品中,差值与差值的频次均服从幂函数规律;

更更有意思的是,按照DNA双链计算获取的幂函数中的回归系数是分别从正、负链中计算获取的幂函数的回归系数的和,指数系数是分别从正、负链中计算获取的幂函数的指数系数的平均值(如下图所示)。

image.png

(六)研究意义

正如运动会开幕式中的广播体操表演,每个人的表演是一种艺术,除此之外,集体的变化也是一种艺术,DNA的甲基化修饰会不会也是如此,特定位置的修饰可能有特定的功能,此外,修饰位点在整个基因组中的分布特征可能也是一种信号,也具有一定的生物功能。


文章来源:

Shi Z, Yu Z, Chen W: 4-Methylcytosine distribution follows the power function in Geobacter sulfurreducens genome. Biochemical and biophysical research communications 2021, 547:65-68.




https://blog.sciencenet.cn/blog-3479210-1290730.html

上一篇:我们为什么选择电能作为能量货币?
下一篇:电磁辐射与生物健康
收藏 IP: 112.54.33.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 01:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部