rxf6chen的个人博客分享 http://blog.sciencenet.cn/u/rxf6chen

博文

RakeSamp: 目前最精细的RNA二级结构随机生成软件/算法

已有 2371 次阅读 2023-2-16 10:25 |系统分类:论文交流

RNA分子参与了细胞里多种生化过程,其功能作用由其结构确定;而通常较容易实验得到的仅有RNA分子所包含的碱基(A,U,G,C)序列,并非由这些碱基相互作用形成化学键进而折叠形成的维结构。

在复杂性和准确度上进行折衷,人们对RNA的二级(二维)结构从数学计算和预测的角度进行了大量研究。 

RNA二级结构里,人们识别出可能对其功能起决定作用的子结构,包括:茎区(stack),发夹环(hairpin),凸包(bulge),内环(internal loop),多环(multiloop),外环(exterior loop)等 。下图为一个RNA二级结构的例子:

motif-rna.png

从计算和预测的角度来讲,一方面需要知道有意义的、满足一定性质的可能结构的数量级,另一方面希望有高效的算法可以随机生成一个满足性质的可能结构 

现有技术:不能计算和设计算法随机生成满足多个子结构联合分布的RNA二级结构

进展:我们给出了满足多个子结构联合分布的精确计算公式,并设计出随机生成一个满足该联合分布RNA二级结构的算法。


单从影响因子来讲,这个工作也可以投影响因子更高的杂志;由于其它考量,最后选择发表在国际生物数学学会旗舰期刊 Bulletin of Mathematical Biology 上。论文链接:RNA Secondary Structures with Given Motif Specification: Combinatorics and Algorithms | SpringerLink


合作者: Christian Reidys (弗吉尼亚大学教授), Michael Waterman(南加州大学教授)


展望:该工作可以潜在用于帮助校准自由能模型的子结构能量参数,可以结合机器学习来预测RNA二级结构等等。


RakeSamp 软件和C++语言代码免费发布在GitHub https://github.com/RickyXFChen/RakeSamp.

欢迎大家使用!





https://blog.sciencenet.cn/blog-3428175-1376479.html

上一篇:我的书《通信新读:从原理到应用》阅读量突破200万,Mark一下!
下一篇:比尔.盖茨的煎饼排序算法,基因组重组距离问题
收藏 IP: 36.57.147.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 12:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部