博文

[CV论文读讲][2012.10.10]Transferring Naive Bayes Classifiers

已有 3676 次阅读 2012-11-30 14:39 |系统分类:科研笔记| 标签, 文章, 数据源, Documents

相关PPT下载详见 “视觉计算研究论坛”「SIGVC BBS」：http://www.sigvc.org/bbs/thread-171-1-1.html

讲者：李海昌
报告时间：2012.10.10
文章信息：
paper #1:Wenyuan Dai, Gui-Rong Xue, Qiang Yang, Yong Yu, Transferring Naive Bayes Classifiers for Text Classification, AAAI 2007.
paper #2:Kamal Nigam, Andrew Kachites Mccallum, Sebastian Thrun, Tom Mitchell, Text Classification from Labeled and Unlabeled Documents using EM, Machine Learning 1999.
文章简介：
Problem: 训练集和测试集来自不同的数据源，分布不同，但来自相同的特征空间。比如：以标注的新闻文档为训练集，对博客文档的话题进行分类。
Model：在已有的贝叶斯分类器和EM结合的算法基础上，给出计算标签数据集和未标签数据集在分类器中所占的比重的方法：计算标签数据分布和未标签数据分布的KL离散度，并手工调出标签数据集和未标签数据集在分类器中所占的最优比重与KL离散度的函数关系。将计算出的比重，作为全局常量带入原模型求解。
Paper #2：
Problem: 文档分类。
Motavition: 使用未标注样本的信息。
Model:使用EM与贝叶斯分类器的组合对文档进行分类，是半监督分类的方法。首先使用标注的数据训练传统的贝叶斯分类器，然后利用得到的分类器对测试样本分类，再使用标注样本和得到的测试样本的后验概率，训练贝叶斯分类器，如此循环直到收敛。

转载本文请联系原作者获取授权，同时请注明本文来自吴怀宇科学网博客。
链接地址：https://blog.sciencenet.cn/blog-4099-637834.html

上一篇：[CV论文读讲] [2012.9.26]Boosting for Transfer Learning
下一篇：[CV论文读讲]Supervised Dictionary Learning

收藏 IP: 123.118.210.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

博文发布时间已经超过87600小时，评论已关闭。

吴怀宇

扫一扫，分享此博文

吴怀宇_中国科学院分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士、副教授「模式识别国家重点实验室」&「中国-欧洲信息,自动化与应用数学联合实验室」

博文

[CV论文读讲][2012.10.10]Transferring Naive Bayes Classifiers

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

吴怀宇

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

吴怀宇_中国科学院分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士、副教授 「模式识别国家重点实验室」&「中国-欧洲信息,自动化与应用数学联合实验室」

博文

[CV论文读讲][2012.10.10]Transferring Naive Bayes Classifiers

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

吴怀宇

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

吴怀宇_中国科学院分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士、副教授「模式识别国家重点实验室」&「中国-欧洲信息,自动化与应用数学联合实验室」

该博文允许注册用户评论请点击登录评论 (0 个评论)