huiwenke的个人博客分享 http://blog.sciencenet.cn/u/huiwenke

博文

MineProt:轻松策展结构蛋白组

已有 1746 次阅读 2022-10-5 09:41 |系统分类:博客资讯

背景

AlphaFold2等AI系统的应用极大提高了结构蛋白组的通量。截至2022年七月,AFDB(https://www.alphafold.ebi.ac.uk/)已收录超过两亿个蛋白质结构,仅用不到一年就超过了PDB五十年积累的一千倍。ColabFold等改进版本的发布则进一步降低了高精度蛋白质结构预测的准入门槛。在此类AI系统的帮助下,蛋白质结构数据规模正不断扩大,其势有如当年NGS技术引发的测序数据爆炸,给研究人员带来了无数挑战和机遇。

结构数据的通量上来了,如何有效策展这些数据自然成为亟待解决的问题。AFDB不可能无延迟地收录世界上所有蛋白质结构,而对大多数研究者来说,开发一个类似AFDB的网站是十分耗时耗力的。为此,笔者介绍一个开源解决方案MineProt(https://github.com/huiwenke/MineProt),研究者可利用该项目轻松搭建一个带图形界面的蛋白质服务器,用于蛋白质结构预测结果的检索、可视化和分享。


部署

如果服务器已安装Docker和docker-compose,MineProt仅需三条指令即可部署。非Docker环境的部署亦不复杂,详情请见部署手册

数据导入

MineProt提供了一系列Python脚本用于将AI系统预测结果转换为与MineProt兼容的蛋白质存储库。当前版本的MineProt支持AlphaFold和ColabFold结果的一键转换。详情请见工具箱手册

用户界面

用户可使用搜索、浏览、3D分析(Mol*支持)等基本功能。此外,MineProt还提供了一个Import页面,专用于生成数据导入所需的命令行。

搜索 & 可视化









浏览









导入辅助









插件

MineProt提供了针对SequenceServer的插件,将BLAST结果与MineProt搜索页面关联。插件可通过油猴脚本安装,或直接嵌入SequenceServer应用。

链接

开源地址:https://github.com/huiwenke/MineProt

文档地址:https://github.com/huiwenke/MineProt/wiki

Demo:home.bmeonline.cn/mineprot-demo/



https://blog.sciencenet.cn/blog-3534451-1358071.html


下一篇:MineProt v0.2.2 更新
收藏 IP: 114.222.38.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 12:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部