|
AlphaFold2等AI系统的应用极大提高了结构蛋白组的通量。截至2022年七月,AFDB(https://www.alphafold.ebi.ac.uk/)已收录超过两亿个蛋白质结构,仅用不到一年就超过了PDB五十年积累的一千倍。ColabFold等改进版本的发布则进一步降低了高精度蛋白质结构预测的准入门槛。在此类AI系统的帮助下,蛋白质结构数据规模正不断扩大,其势有如当年NGS技术引发的测序数据爆炸,给研究人员带来了无数挑战和机遇。
结构数据的通量上来了,如何有效策展这些数据自然成为亟待解决的问题。AFDB不可能无延迟地收录世界上所有蛋白质结构,而对大多数研究者来说,开发一个类似AFDB的网站是十分耗时耗力的。为此,笔者介绍一个开源解决方案MineProt(https://github.com/huiwenke/MineProt),研究者可利用该项目轻松搭建一个带图形界面的蛋白质服务器,用于蛋白质结构预测结果的检索、可视化和分享。
如果服务器已安装Docker和docker-compose,MineProt仅需三条指令即可部署。非Docker环境的部署亦不复杂,详情请见部署手册。
MineProt提供了一系列Python脚本用于将AI系统预测结果转换为与MineProt兼容的蛋白质存储库。当前版本的MineProt支持AlphaFold和ColabFold结果的一键转换。详情请见工具箱手册。
用户可使用搜索、浏览、3D分析(Mol*支持)等基本功能。此外,MineProt还提供了一个Import页面,专用于生成数据导入所需的命令行。
搜索 & 可视化
浏览
导入辅助
MineProt提供了针对SequenceServer的插件,将BLAST结果与MineProt搜索页面关联。插件可通过油猴脚本安装,或直接嵌入SequenceServer应用。
开源地址:https://github.com/huiwenke/MineProt
文档地址:https://github.com/huiwenke/MineProt/wiki
Demo:home.bmeonline.cn/mineprot-demo/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-17 12:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社