科学网

 找回密码
  注册
相关矩阵的图形表示
彭友松 2011-7-23 16:44
刚看到一个R包corrplot可以很漂亮和形象的展示相关矩阵,而且可以进行聚类。该包的参数特别多,我只关心下面两个:一个是输入数据为相关矩阵,可以是全矩阵,下三角或者上三角;另外一个矩阵展示中元素的顺序,可以是原来的顺序,也可以用聚类的方法,这可以使用参数order来指定。 corrplot(corr,order = c("original", ...
个人分类: 统计学与R语言学习|6185 次阅读|没有评论
去除冗余序列的超快超好用工具cd-hit
热度 6 彭友松 2011-7-21 16:03
这个软件(也有在线服务器,见其官网 http://www.bioinformatics.org/cd-hit/ )是中国人( Weizhong Li )写的,很好用,最大的特点就是快。基本思路是首先对所有序列按照其长度进行排序,然后从最长的序列开始,形成第一个序列类,然后依次对序列进行处理,如果新的序列与已有的序列类的代表序列的相似性在cutoff以 ...
个人分类: 生物信息学与计算生物学|34161 次阅读|10 个评论 热度 6
R语言中的颜色问题
彭友松 2011-7-15 16:02
1 R中有多少种颜色?怎么看? 命令:colors()显示出下面的657种颜色 "white" "aliceblue" "antiquewhite" "antiquewhite1" "an ...
个人分类: 统计学与R语言学习|25772 次阅读|没有评论
非常快速的建树软件FastTree
热度 2 彭友松 2011-6-21 11:30
FastTree http://www.microbesonline.org/fasttree/ Also see Fast Tree-Comparison Tools FastTree infers approximately-maximum-likelihood phylogenetic trees from alignments of nucleotide or protein sequences. FastTree can handle alignments with up to a million ...
个人分类: 生物信息学与计算生物学|20041 次阅读|4 个评论 热度 2
Perl语言中的splice()函数的用法及其用于对数组的随机扰动
彭友松 2011-6-17 10:11
splice函数有四种用法: 1 在数组中用其他元素代替数组部分元素,用法为splice(@list,offset,length,@new),即把@new中的元素替换数组@list中从offset位置开始且长度为length的元素。 2 从数组中删除元素,用法为splice(@list,offset,length),即把数组@list中从offset开始长度为length的元素去掉。 3 清空数组,用法为spl ...
个人分类: 统计学与R语言学习|17554 次阅读|没有评论
分子生物学中常用数据库
彭友松 2011-6-9 10:40
转自生物统计家园 http://www.biostatistic.net/thread-2498-1-1.html 下面的数据库很有用,所以先保存下来了。非常感谢生物统计家园的总结! 综合数据库: 最权威的生物信息学网址链接: http://www.bioinformatics.vg 生物信息学网址链接: http://www.bioinformatics.ca/links_directory/ Nuclei ...
个人分类: 生物信息学与计算生物学|12146 次阅读|没有评论
R中的遗传算法
彭友松 2011-6-8 15:27
在R中我发现了四个软件包使用遗传算法进行参数选择和目标函数优化,如下所示: 1GALGO 2genalg rbga(stringMin=c(), stringMax=c(), suggestions=NULL, popSize=200, iters=100, mutationChance=NA, elitism=NA, monitorFunc=NULL, evalFunc=NULL, showSettings=FALSE, verbose=FALSE) 3 mcga ...
个人分类: 统计学与R语言学习|10788 次阅读|没有评论
《Linear models with R 》学习笔记之一
彭友松 2011-6-2 21:44
一本好的参考书不应该只告诉读者技术性或者知识性的东西,还应该把作者的思想和经验与读者交流。刚看了这本书第一章的前面几页就觉得这本书不错,因为作者告诉我们怎样成为一位合格的统计学家,而不是仅仅会用统计学作为工具。第一章的第一句话是这么说的: Statistics starts with a problem, pr ...
个人分类: 统计学与R语言学习|5888 次阅读|没有评论
R中的排列组合,阶乘的计算
彭友松 2011-6-2 10:04
参考了网上的一些资料,得到了下面的一些函数可以做这些事。 组合数的计算:从N中选择K个用函数 choose(N,K) 阶乘的计算有三种方法: 1)factorial(N),最快的方法 2) prod(1:N),最慢的方法 3) gamma(N+1),也是非常快的算法 可以看下面的一个测试: system.time(replicate(10000000,gamma(101))) ...
个人分类: 统计学与R语言学习|33223 次阅读|没有评论
对于bootstrap的一些粗浅认识-2
彭友松 2011-5-31 20:25
bootstrap percentile confidenceinterval和bootstrap t confidence interval的比较 先说bootstrap percentile confidence interval的概念,它是指某统计量的bootstrap分布的2.5%和97.5%的间距。两种可信度区间的应用条件不一样,当bootstrap distribution近似符合正态分布,而且bias很小的时候,一般用t可信度区间 ...
个人分类: 统计学与R语言学习|12486 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 16:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部