夜雪5的个人博客分享 http://blog.sciencenet.cn/u/夜雪5

博文

数据挖掘研究相关记录

已有 3705 次阅读 2012-11-5 21:35 |系统分类:科研笔记| style, 记录

研究问题:

1、  为什么Naïve BayesionBayesion的有效性差不多?

2、  如何预先得知一堆数据中cluster的个数?

3、  如何评估一个cluster的好坏?

4、  异质网络中,那条meta-path真正起作用?作用是什么?

 

好问题的特征:

1、  大家都知道这样却不知道为什么这样的问题;

2、  研究****是否可行;


数据挖掘方面三大会议

KDD:注重新颖的application, principle更重要,看重fundamental idea

ICDM: 注重技巧、数学公式和推理

SDM:与统计、数学有关的东西在SDM上比较严格

 

Microsoft Belief Networks

用于贝叶斯推理,贝叶斯网络的求解工具

http://www.idi.ntnu.no/~dingsoyr/diploma/node37.html

 

加州大学机器学习数据库

这个数据库中有各种数据集,需要用的时候可以下载。

http://archive.ics.uci.edu/ml/

 

DBLP是科研中重要的工具,其中可以获得各种会议期刊书籍作者的信息,多用!!!

http://www.informatik.uni-trier.de/~ley/db/

如何使用DBLP的文档: http://dblp.uni-trier.de/xml/docu/dblpxml.pdf

若想使用DBLP中的数据作为研究对象可以研读韩家炜实验室的文章,以及DBLP的说明。

 

Jiawei Han的主页

其中列有他的文章和书籍等等,很有价值,随时关注其动态

http://www.cs.uiuc.edu/~hanj/

 

有价值的网页

1、  了解KDD的发展ACM SIGKDD: Current Explorations Issues  

2、  迁移学习资源:www.cse.ust.hk/TL

 

思维充电:

1、  抽象代数

2、  范畴论

3、  计算几何

 



https://blog.sciencenet.cn/blog-545746-629596.html

上一篇:公开课课程列表
下一篇:科研模式
收藏 IP: 115.156.216.*| 热度|

1 牛钢

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 13:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部