|||
学术报告通知
题 目:如何确定给定数据集中的聚簇个数?
报 告 人:徐硕 博士
时 间:2010年5月28日(星期五)上午9:00
地 点:中国科学技术信息研究所三层333教室
(北京复兴路15号,中央电视台西侧)
报告内容:
聚类分析就是将研究对象划分为不同的聚簇,使得每个聚簇中对象间的相似度尽可能高,而不同聚簇中对象间的相似度尽可能低。通过观察二维散点图人们可以很容易指出对应数据集中的聚簇结构,但让计算机从数据集中自动识别潜在的聚簇结构并不是一件容易的事。困难之一在于如何准确估计数据集中包含的聚簇个数,其根本原因在于目前缺乏一个评价聚类结果质量以及比较两种聚类结果的客观方式。
本报告将确定聚簇个数的方法分为三大类:内部度量法、外部度量法以及基于聚类稳定性的方法。除了对每种方法的原理进行介绍之外,还将重点介绍每种方法的优缺点以及各种方法间的关系,并针对一种典型应用场景给出一些指导性建议。
报告人简介:
徐硕,2003年获理学学士学位,2008年中国农业大学农业电气化与自动化专业,研究方向为计算机网络与智能信息处理,主要从事生物数据的数据挖掘工作,获工学博士学位。2008至今,进入我所从事博士后科研工作,合作导师为乔晓东研究员、朱礼军副研究员,研究课题为知识组织系统自动构建与应用关键技术研究。参与或主持的项目包括“十一五”国家科技支撑计划重点项目子课题、国家863项目、教育部人文社科研究项目、所重点工作项目、江苏省社科基金项目等。近5年来在国内外期刊和会议上发表或录用学术论文20余篇。
欢迎所内外各界人士踊跃参加!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 04:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社