科学网

 找回密码
  注册
关于聚类的一些经验及其在R中的实现
彭友松 2012-3-19 15:15
1 首先针对数据进行分析,回答下面的问题: 1 )想用聚类方法解决什么问题。是想看数据的结构,还是想把数据分为很多类,还是有其他的目的。 2 )数据本身的分布。针对样本聚类还是针对变量聚类?样本可能符合怎样的分布?变量又会符合怎样的分布? 2 选择合适的聚类方法 针对聚类目的和数据的分布, ...
个人分类: 统计学与R语言学习|21867 次阅读|没有评论
R语言中坐标轴刻度值的灵活处理
彭友松 2011-8-19 17:40
在R中处理坐标轴的函数为axis(),我现在关心的是如何改变坐标轴的刻度位置,以及刻度标记。axis()中的参数at和labels可以解决这个问题。at表示坐标轴刻度的位置,可以自己指定,比如at=c(1,2,3,4,5,5.5,5.6,6,7),labels表示与坐标轴刻度相对应的坐标轴标记,如labels=c(1,2,3,4,5,5.5,5.6,6,7)。如果要改变坐标轴,首先在画 ...
个人分类: 统计学与R语言学习|60327 次阅读|没有评论
R中评估层次聚类可信度的包Pvclust
彭友松 2011-8-15 16:16
就像进化树中分支需要给出bootstrap值一样,层次聚类后得到的类别划分也需要给出其可信度。R中提供了这样一个包Pvclust,它采用bootstrap重新采样的思路,对于给定的数据进行重新采样,然后会给出每个节点的可信度(AU值和BP值)。需要指出的是,它要求提供原始数据,而不能是已经计算好的距离矩阵,比如说microarray的数据 ...
个人分类: 统计学与R语言学习|8576 次阅读|没有评论
强烈推荐--R的集成环境RStudio
彭友松 2011-8-12 10:07
推荐一下该东东,虽然我刚知道还没有开始用,但是它看起来很方便。现在我还是比较习惯在命令行里面操作,等以后再用吧。 RStudio有Windows和Linux环境下的版本,见 http://rstudio.org/
个人分类: 统计学与R语言学习|4404 次阅读|没有评论
相关矩阵的图形表示
彭友松 2011-7-23 16:44
刚看到一个R包corrplot可以很漂亮和形象的展示相关矩阵,而且可以进行聚类。该包的参数特别多,我只关心下面两个:一个是输入数据为相关矩阵,可以是全矩阵,下三角或者上三角;另外一个矩阵展示中元素的顺序,可以是原来的顺序,也可以用聚类的方法,这可以使用参数order来指定。 corrplot(corr,order = c("original", ...
个人分类: 统计学与R语言学习|6188 次阅读|没有评论
R语言中的颜色问题
彭友松 2011-7-15 16:02
1 R中有多少种颜色?怎么看? 命令:colors()显示出下面的657种颜色 "white" "aliceblue" "antiquewhite" "antiquewhite1" "an ...
个人分类: 统计学与R语言学习|25781 次阅读|没有评论
Perl语言中的splice()函数的用法及其用于对数组的随机扰动
彭友松 2011-6-17 10:11
splice函数有四种用法: 1 在数组中用其他元素代替数组部分元素,用法为splice(@list,offset,length,@new),即把@new中的元素替换数组@list中从offset位置开始且长度为length的元素。 2 从数组中删除元素,用法为splice(@list,offset,length),即把数组@list中从offset开始长度为length的元素去掉。 3 清空数组,用法为spl ...
个人分类: 统计学与R语言学习|17556 次阅读|没有评论
R中的遗传算法
彭友松 2011-6-8 15:27
在R中我发现了四个软件包使用遗传算法进行参数选择和目标函数优化,如下所示: 1GALGO 2genalg rbga(stringMin=c(), stringMax=c(), suggestions=NULL, popSize=200, iters=100, mutationChance=NA, elitism=NA, monitorFunc=NULL, evalFunc=NULL, showSettings=FALSE, verbose=FALSE) 3 mcga ...
个人分类: 统计学与R语言学习|10789 次阅读|没有评论
《Linear models with R 》学习笔记之一
彭友松 2011-6-2 21:44
一本好的参考书不应该只告诉读者技术性或者知识性的东西,还应该把作者的思想和经验与读者交流。刚看了这本书第一章的前面几页就觉得这本书不错,因为作者告诉我们怎样成为一位合格的统计学家,而不是仅仅会用统计学作为工具。第一章的第一句话是这么说的: Statistics starts with a problem, pr ...
个人分类: 统计学与R语言学习|5893 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 20:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部