陈安分享 http://blog.sciencenet.cn/u/陈安博士 御风而行,把酒邀月,穷极宇宙,留意身边

博文

一周《数据分析》与《数据挖掘》课程讲授情况纪要

已有 4814 次阅读 2009-3-8 20:47 |个人分类:专论—应急管理|系统分类:教学心得

一、《数据分析》第三讲——非参数方法

??时间:2009年3月4日 星期三  08:30 
??地点:中科院基础科学园区思源楼1205会议室  
??参加人: 
??中国科学院科技政策与管理科学研究所:陈安、倪慧荟、李季梅 
??中国科学院研究生院:赵燕、李培培、武艳南
??山东经济学院:马建华 
??河南大学:上官艳秋

??山东大学:张睿、亓菁晶

??中国矿业大学(北京):张昊宇
??河北工程大学:程瑶

??河海大学:陈蓉
??整理人:亓菁晶

??2009年3月4日上午08:30,“应急管理创新团队”新学期开设的《数据分析》课程第三讲在思源楼1205进行。

??第三讲由亓菁晶负责。在今天的授课中,亓菁晶主要给大家讲授了非参数方法中的两种秩检验方法:Wilcoxon秩和检验和Smirnov检验。

??首先,亓菁晶向大家简单介绍了参数方法和非参数方法的区别,以及随机化模型、观测值的秩、秩的零分布等基本概念。

??然后,开始详细讲解第二小节Wilcoxon秩和检验的使用。第一部分是单边假设检验。在这一部分中,给出了统计量的定义,统计量的零分布的计算方法,以及在什么情况下应该拒绝原假设。第二部分是双边假设检验。这一部分中,给出了与单边假设检验中略有不同的备择假设。其求解过程与第一部分类似。第三部分是Wilcoxon统计量的渐进零分布。利用了中心极限定理来求解p值。第四部分是对结点的处理,给出了结点存在时秩的计算公式。

??第三小节是总体模型的Wilcoxon秩和检验。在这一部分,亓菁晶向大家提出了自己看书时的一个疑问。大家展开了激烈的讨论,并得出了一个较为合理的结论。

??第四小节是Smirnov检验。该检验可用于检验两方法处理效果的分散性,弥补了Wilcoxon秩和检验的一个不足。这一节给出了统计量的定义,统计量的零分布,以及m,n较大时的渐进式。

??最后陈老师对今天的内容进行了全面的总结,以便大家更好的理解。

二、《数据挖掘技术及应用》第二讲——关联规则挖掘

??2009年3月6日星期五上午10:00-12:00,应急管理创新团队《数据挖掘技术及应用》课程继续开展,陈安老师讲述了“关联规则挖掘”的主要内容。

??首先,陈安老师介绍了数据挖掘中两个最核心的概念,就是支持度和置信度。随后,开始介绍了最经典的二值关联规则的挖掘,从AIS和Apriori算法开始介绍,对关联规则挖掘算法的主要思想,算法过程,以及算法的举例等都进行了详细介绍,随后,又对关联规则挖掘的并行算法,数值型关联规则挖掘的主要思想和技术方法,多层次关联规则的挖掘,以及增量型的关联规则挖掘进行了说明。

??由于同学们对于关联规则的挖掘只听其名而没有认真从根本上学习过这一方法,所以,陈安老师的讲述尽可能地详细具体,希望同学们都能从最核心最本质的角度理解数据挖掘。

??在介绍方法的同时,课程还主要对挖掘的思想进行了介绍,包括第一个算法的提出,以及在算法效率和其他更多类型关联规则挖掘的思想提出。

??课后,大家愉快地共享了每人10元钱的午餐。



https://blog.sciencenet.cn/blog-53483-219145.html

上一篇:包法利夫人万岁,女人万岁!
下一篇:“现代应急”学术沙龙报告集萃【二】
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 23:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部