||
研究问题:
1、 为什么Naïve Bayesion和Bayesion的有效性差不多?
2、 如何预先得知一堆数据中cluster的个数?
3、 如何评估一个cluster的好坏?
4、 异质网络中,那条meta-path真正起作用?作用是什么?
好问题的特征:
1、 大家都知道这样却不知道为什么这样的问题;
2、 研究****是否可行;
数据挖掘方面三大会议
KDD:注重新颖的application, principle更重要,看重fundamental idea
ICDM: 注重技巧、数学公式和推理
SDM:与统计、数学有关的东西在SDM上比较严格
Microsoft Belief Networks
用于贝叶斯推理,贝叶斯网络的求解工具
http://www.idi.ntnu.no/~dingsoyr/diploma/node37.html
加州大学机器学习数据库
这个数据库中有各种数据集,需要用的时候可以下载。
http://archive.ics.uci.edu/ml/
DBLP是科研中重要的工具,其中可以获得各种会议期刊书籍作者的信息,多用!!!
http://www.informatik.uni-trier.de/~ley/db/
如何使用DBLP的文档: http://dblp.uni-trier.de/xml/docu/dblpxml.pdf
若想使用DBLP中的数据作为研究对象可以研读韩家炜实验室的文章,以及DBLP的说明。
Jiawei Han的主页
其中列有他的文章和书籍等等,很有价值,随时关注其动态
有价值的网页
1、 了解KDD的发展ACM SIGKDD: Current Explorations Issues
2、 迁移学习资源:www.cse.ust.hk/TL
思维充电:
1、 抽象代数
2、 范畴论
3、 计算几何
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 13:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社