高山流水分享 http://blog.sciencenet.cn/u/friendpine 走在科学路上的一位无名侠客,只是静静的走着.........

博文

分子生物学中常用数据库

已有 12771 次阅读 2011-6-9 10:40 |个人分类:生物信息学与计算生物学|系统分类:科研笔记

转自生物统计家园http://www.biostatistic.net/thread-2498-1-1.html
下面的数据库很有用,所以先保存下来了。非常感谢生物统计家园的总结!

综合数据库:

最权威的生物信息学网址链接:http://www.bioinformatics.vg 

生物信息学网址链接:http://www.bioinformatics.ca/links_directory/

Nucleic Acid Research Database Issue:http://nar.oupjournals.org/content/vol32/suppl_2/ 

一、蛋白相关数据库蛋白质结构域预测工具


Esignal:http://motif.stanford.edu/esignal/ 

信号传导系统蛋白的结构域预测工具,凡是涉及到信号传导系统的蛋白用这个预测效果最佳

SignalP:http://www.cbs.dtu.dk/services/SignalP/ 

信号肽预测工具,适合定位于非胞质位置的蛋白质

Emotif:http://motif.stanford.edu/emotif-search/ 

结构域预测工具,由于其用motif电子学习的方法产生结构域模型,故预测效果比Prosite好

Ematrix:http://fold.stanford.edu/ematrix/ 

是用Matrix的方法创建的结构域数据库,可与emotif互相印证。其速度快,可快速搜索整个基因组

InterPro:http://www.ebi.ac.uk/InterProScan/ 

EBI提供的服务,用图形的形式表示出搜索的结构域结果

TRRD:http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/ 

转录因子结构域预测的最好数据库。但不会用

Protscale:http://cn.expasy.org/cgi-bin/protscale.pl

可分析该序列的各种性状如活动度、亲水性(Kyte&Doolittle)、抗原性(Hopp&Woods)等

通过寻找MOTIF和Domain来分析蛋白质的功能

A. MOTIF是蛋白中较小的保守序列片断,其概念比Domain小

PROSITE:http://cn.expasy.org/tools/scanprosite/ 

是专门搜索蛋白质Motif的数据库,其中signature seqs是最重要的motif信息

B. Domain:若干motif可形成一个Domain,每个Domain形成一个球形结构,Domain与Domain之间通常像串珠一样相连

Pfam:http://www.sanger.ac.uk 

可以搜索某段序列中的Domain,并以图形化表示出来。这个数据库非常重要。用法:在搜索栏中输入蛋白的swissprot的序列号

CDD:http://www.ebi.ac.uk/interpro/

NCBI搜索时在每个蛋白质Link旁都有Blink,Domains两个链接。Domains可以直接看到这个蛋白的确定的结构域。如果要在CDD数据库寻找Domain信息,则可进入Blink链接,再进行CDD搜索,就可以了。看Domain的详细信息可以到:http://www.ebi.ac.uk/interpro/上进行搜索查看

蛋白跨膜序列分析

kyte-Doolittle疏水性分析:每个等于或高于1.8的峰都可能是跨膜结构域

蛋白质结构预测工具

PREDATOR:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_preda.html 

蛋白质二级结构预测工具

蛋白质糖基化位点的预测

http://bioresearch.ac.uk/browse/mesh/C0017982L1222670.html 

这是个综合连接。包括:DictyOGlyc prediction server,NetOGlyc prediction server,YinOYang server,META II PredictProtein server,O-GLYCBASE,GlycoMod tool

蛋白质结构数据库

MMDB:http://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml 

NCBI的蛋白质结构数据库,要使用Cn3D v4.1软件观看

PDB:http://www.rcsb.org/pdb/ 

Protein Data Bank, 要使用Swiss PDB viewer软件观看

蛋白质综合数据库

PIR:http://pir.georgetown.edu

Uniprot http://www.pir.uniprot.org

二、核酸相关数据库

三大主要核酸序列数据库:

EMBL:http://www.ebi.ac.uk/embl/

GenBank:http://www.ncbi.nlm.nih.gov/Genbank/

DDBJ:http://www.ddbj.nig.ac.jp

RNA二级结构及非编码区功能预测:

RNA二级结构预测:http://www.genebee.msu.su/services/rna2_reduced.html

速度快,生成图像

最好的RNA二级结构预测软件:mfold

UTR功能区预测:http://bighost.area.ba.cnr.it/BIG/UTRHome/ 

预测mRNA翻译能力的在线工具:http://wwwmgs.bionet.nsc.ru/programs/acts2/ma_mRNA.htm 

其说明书在:http://wwwmgs.bionet.nsc.ru/mgs/papers/kochetov/bioinf/

RegRNA:http://bidlab.life.nctu.edu.tw/RegRNA2/website/ 

RFAM:http://www.sanger.ac.uk/Software/Rfam/

RNA world:http://www.imb-jena.de/RNA.html 

RNA resource Links:http://bidlab.life.nctu.edu.tw/RegRNA2/website/references/

基因转录调控相关数据库

EPD http://www.epd.isb-sib.ch

真核生物启动子,好用

TRRD:Transcription Regulatory Regions Database 

可搜索某一基因的调控区及相关转录因子

TRANSFAC:http://www.generegulation.de

可搜索所有转录因子的数据,好用

启动子数据库:http://www.epi.isb-sib.ch 

转录因子结合位点 http://www.ejbiotechnology.info/content/vol3/issue3/full/2/bip/ 

电子延伸相关在线软件

意大利CAP3软件:http://bio.ifom-firc.it/ASSEMBLY/assemble.html 

强烈推荐使用,使用时只需将整个Unigene全部序列文件输入就可以了

序列比对在线软件

Multialin:http://prodes.toulouse.inra.fr/multalin/multalin.html 

最好的多序列比对在线工具

FASTA:http://www.ebi.ac.uk/fasta/http://fasta.bioch.virginia.edu

BLAST:http://www.ncbi.nih.gov/BLAST/ 

Motif的发现与利用Motif发现新的功能基因

MEME:http://meme.sdsc.edu/meme/website/intro.html 

可以发现几个序列所共有的motif以及根据已知的motif搜索est数据库以发现新的基因,此软件输出结果不好读懂

BLOCK Maker:http://blocks.fhcrc.org

in which Block maker is Very Good

http://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html 

可通过蛋白多序列比对寻找其中的保守区域,非常好用,易学

IRES及其他UTR功能序列的预测

UTRscan:http://bighost.area.ba.cnr.it/BIG/UTRScan/http://www.ba.itb.cnr.it/BIG/UTRScan/

需要先注册email

三、表达数据库

EST聚类表达数据资源

Unigene:http://www.ncbi.nlm.nih.gov/unigene/

不用说了,老牌的EST聚类程序,数据库质量很好,但毛病也不少,不过我常用它

TIGR:http://www.tigr.org/tdb/tgi/ 

按独一无二的剪接体对EST进行聚类,并从中得出独一无二的共有的序列,每个Cluster的EST都有图形排列显示

Allgenes:http://www.allgenes.org

其EST聚类要求比较严格,但每个Cluster都有一个质量极高的mRNA序列,可轻松定位到基因组上

MIPS:http://mips.gsf.de/proj/human/ 

MIPS的EST聚类数据库。其中有个工具特别好,就是在BLAST服务中有个可以得到与BLAST基因相近EST的组织分布的程序

特殊的表达数据库

前列腺表达数据库:http://www.pedb.org

膀胱癌EST数据库:http://bladder.nhri.org.tw

Microarray和SAGE表达数据库及其分析工具

全身正常组织microarray数据(U133A, U133B):http://www.dev.gmod.org 

较全的全身正常组织microarray数据库,推荐,要搜索表达数据需在search中数据探针名称(U133A, U133B),注意必须安装Adobe SVG Viewer,得到的数据需要用photoshop颠倒过来才能观看。

斯坦福大学生物芯片数据库:http://genome-www5.stanford.edu/ 

最好的生物芯片数据库,不仅数据源丰富,而且数据搜索软件功能齐全,但要学会也需要点时间

CleanEX:http://www.cleanex.isb-sib.ch

用于分析比较来源于不同技术平台的表达数据

EBI array database:http://www.ebi.ac.uk/arrayexpress/ 

欧洲生物信息学会主办的基因芯片数据库

RAD:http://www.cbil.upenn.edu/RAD/php/

功能与CleanEX近似,推荐使用

Gene Expression Db:http://discover.nci.nih.gov 

提供60多个肿瘤细胞系的基因芯片数据

NIAID:http://madb.niaid.nih.gov

ONCOMINE:http://141.214.6.50/oncomine/main/

AWR1Uko AND MY EMAIL非常好的肿瘤microarray数据库

GENEHOPPER:http://genehopper.lumc.nl/db/ 

利用accession num将microarray数据与Genebank进行连接的软件

NetAffx:https://www.affymetrix.com/analysis/netaffx/index.affx 

Microarray Anotation Database:探针注释数据库

四、其它数据库

免疫学相关数据库

MHCI结合表型预测:http://bimas.dcrt.nih.gov/molbio/hla_bind/

已经试过,非常好用

两种常用表位预测数据库

ProPred-I: http://www.imtech.res.in/raghava/propred1/

SYFPEITHI:http://www.uni-tuebingen.de/uni/kxi/

MHCI表型预测与蛋白酶体降解分析

SYFPEITHI的MHCI表型预测工具:http://syfpeithi.bmi-heidelberg.com/Scripts/MHCServer.dll/EpitopePrediction.htm

SEREX数据库:http://www2.licr.org/CancerImmunomeDB/ 

CT抗原数据库:http://www.cancerimmunity.org/CTdatabase/ 

Immunology相关工具综合:http://www.cancerimmunity.org

特殊数据库

McGill:http://ww2.mcgill.ca/androgendb/ 

雄激素受体数据库

肿瘤数据库

染色体突变数据库:http://www.infobiogen.fr/services/chromcancer/

内源性逆转录病毒数据库:http://www.girinst.org

包含100多个内源性逆转录病毒家族,每个家族都给出了共有序列

基因注释数据库

ensemble:http://www.ensembl.org/Homo_sapiens/ 

综合各种基因注释的平台

OE:http://vortex.cs.wayne.edu/Projects.html 

基因功能注释的重要工具,提供每个注释的生物学意义的评分

GENMAPP:

将基因芯片数据综合在各种生物通路上,帮助分析表达数据的生物学意义

GeneCard:http://bioinformatics.weizmann.ac.il/cards/ 

很全的基因卡片

突变数据库

HGMD突变数据库:http://archive.uwcm.ac.uk/uwcm/mg/hgmd/search.html 

包含各种疾病和基因的突变数据

肿瘤基因数据库:http://condor.bcm.tmc.edu/ermb/tgdb/tgdb.html 

搜索起来不是很方便

比较基因组学数据库

VISTA:http://www-gsd.lbl.gov/vista/ 

最重要的比较基因组学在线软件,强烈推荐使用

PCR相关网站

引物数据库:http://pga.mgh.harvard.edu/primerbank/ 

含180000条mRNA特异引物,非常好用

方便的实验室运算软件

MOLBIOL.RU:http://molbiol.ru/eng/scripts/

可以进行随机核酸序列的产生,PCR条件优化运算等

密码子使用频度数据库:http://www.kazusa.or.jp/codon/ 


https://blog.sciencenet.cn/blog-54276-453229.html

上一篇:R中的遗传算法
下一篇:Perl语言中的splice()函数的用法及其用于对数组的随机扰动
收藏 IP: 159.226.118.*| 热度|

1 周小玲

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-5 10:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部