科学网

 找回密码
  注册
搜索
热搜: 科学 论文
搜索
分享 去除冗余序列的超快超好用工具cd-hit
热度 6 彭友松 2011-7-21 16:03
这个软件(也有在线服务器,见其官网 http://www.bioinformatics.org/cd-hit/ )是中国人( Weizhong Li )写的,很好用,最大的特点就是快。基本思路是首先对所有序列按照其长度进行排序,然后从最长的序列开始,形成第一个序列类,然后依次对序列进行处理,如果新的序列与已有的序列类的代表序列的相似性在cutoff以 ...
个人分类: 生物信息学与计算生物学|24937 次阅读|10 个评论 热度 6
分享 R语言中的颜色问题
彭友松 2011-7-15 16:02
1 R中有多少种颜色?怎么看? 命令:colors()显示出下面的657种颜色 "white" "aliceblue" "antiquewhite" "antiquewhite1" "an ...
个人分类: 统计学与R语言学习|17499 次阅读|没有评论
分享 非常快速的建树软件FastTree
热度 2 彭友松 2011-6-21 11:30
FastTree http://www.microbesonline.org/fasttree/ Also see Fast Tree-Comparison Tools FastTree infers approximately-maximum-likelihood phylogenetic trees from alignments of nucleotide or protein sequences. FastTree can handle alignments with up to a million ...
个人分类: 生物信息学与计算生物学|13399 次阅读|4 个评论 热度 2
分享 Perl语言中的splice()函数的用法及其用于对数组的随机扰动
彭友松 2011-6-17 10:11
splice函数有四种用法: 1 在数组中用其他元素代替数组部分元素,用法为splice(@list,offset,length,@new),即把@new中的元素替换数组@list中从offset位置开始且长度为length的元素。 2 从数组中删除元素,用法为splice(@list,offset,length),即把数组@list中从offset开始长度为length的元素去掉。 3 清空数组,用法为spl ...
个人分类: 统计学与R语言学习|14185 次阅读|没有评论
分享 分子生物学中常用数据库
彭友松 2011-6-9 10:40
转自生物统计家园 http://www.biostatistic.net/thread-2498-1-1.html 下面的数据库很有用,所以先保存下来了。非常感谢生物统计家园的总结! 综合数据库: 最权威的生物信息学网址链接: http://www.bioinformatics.vg 生物信息学网址链接: http://www.bioinformatics.ca/links_directory/ Nuclei ...
个人分类: 生物信息学与计算生物学|7707 次阅读|没有评论
分享 R中的遗传算法
彭友松 2011-6-8 15:27
在R中我发现了四个软件包使用遗传算法进行参数选择和目标函数优化,如下所示: 1GALGO 2genalg rbga(stringMin=c(), stringMax=c(), suggestions=NULL, popSize=200, iters=100, mutationChance=NA, elitism=NA, monitorFunc=NULL, evalFunc=NULL, showSettings=FALSE, verbose=FALSE) 3 mcga ...
个人分类: 统计学与R语言学习|8593 次阅读|没有评论
分享 《Linear models with R 》学习笔记之一
彭友松 2011-6-2 21:44
一本好的参考书不应该只告诉读者技术性或者知识性的东西,还应该把作者的思想和经验与读者交流。刚看了这本书第一章的前面几页就觉得这本书不错,因为作者告诉我们怎样成为一位合格的统计学家,而不是仅仅会用统计学作为工具。第一章的第一句话是这么说的: Statistics starts with a problem, pr ...
个人分类: 统计学与R语言学习|4076 次阅读|没有评论
分享 R中的排列组合,阶乘的计算
彭友松 2011-6-2 10:04
参考了网上的一些资料,得到了下面的一些函数可以做这些事。 组合数的计算:从N中选择K个用函数 choose(N,K) 阶乘的计算有三种方法: 1)factorial(N),最快的方法 2) prod(1:N),最慢的方法 3) gamma(N+1),也是非常快的算法 可以看下面的一个测试: system.time(replicate(10000000,gamma(101))) ...
个人分类: 统计学与R语言学习|23357 次阅读|没有评论
分享 对于bootstrap的一些粗浅认识-2
彭友松 2011-5-31 20:25
bootstrap percentile confidenceinterval和bootstrap t confidence interval的比较 先说bootstrap percentile confidence interval的概念,它是指某统计量的bootstrap分布的2.5%和97.5%的间距。两种可信度区间的应用条件不一样,当bootstrap distribution近似符合正态分布,而且bias很小的时候,一般用t可信度区间 ...
个人分类: 统计学与R语言学习|8205 次阅读|没有评论
分享 对于bootstrap的一些粗浅认识
彭友松 2011-5-30 22:11
什么是bootstrap? bootstrap就是从一个原始样本中进行有放回的重复采样,采样大小和原始样本大小相同,采样次数根据计算量而定。从每个重新样的样本中可以计算某个统计量的bootstrap 分布,比如说均值,多个重采样样本的均值构成了原始样本均值的bootstrap分布。在采样完后需要检查待研究统计量的bootstrap分布是不是符合 ...
个人分类: 统计学与R语言学习|18656 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-3-29 23:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部