鲁晨光的科学和哲学研究分享 http://blog.sciencenet.cn/u/lcguang 兴趣:色觉, 哲学, 美学, 进化论,广义信息,投资组合

博文

想不到有那么多人研究EM算法

已有 4909 次阅读 2017-5-17 13:06 |个人分类:信息的数学和哲学|系统分类:科研笔记| 信息论, 机器学习, 似然度

介绍见:https://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm

https://wizardforcel.gitbooks.io/dm-algo-top10/content/em.html


光是标题中有 EM algorithm 的论文就有3000多篇。

http://www.sciencedirect.com/science?_ob=ArticleListURL&_method=list&_ArticleListID=-1202695715&_sort=r&_st=13&view=c&md5=a65f3a03da9eeed4a63c602ea9857144&searchtype=a

它通常用于混合模型(比如高斯混合模型)。 比如根据两个似然函数不同比例的混合, 求解最为符合的似然函数参数(两个高斯模型有4个参数)和比例(1个参数)。现在大数据热, 研究的人更多。

我碰巧赶上了。实验结果见下图。求出结果不算什么, 简单快速才算好。能证明收敛才算厉害。


我可是用Excel做的喔。证明嘛,我用的是语义信息方法,特别是R(G)函数(上一篇介绍的)。 具体方法和证明正在整理。

迭代收敛过程:

5次迭代后符合程度:


迭代开始:


想不到Excel做研究工具还真不错, 不但计算简单, 画图也方便。通过绘图, 容易发现错误。


补充:假设

Py1=0.10000
c1=35
d1=
8.000000
Py2=0.90000
c2=65
d2=
12.000000

所有EM算法都面临这个例子挑战! 因为在M-step和E-step之间,有一个巨大裂缝, ElogP(z,y|模型)能大幅下降。如果这样, 那些收敛证明成立?


但是信道匹配算法没有问题。




https://blog.sciencenet.cn/blog-2056-1055447.html

上一篇:冒名奇观《信息论在经济中的应用》-胡志远
下一篇:公布求解最大互信息和最大似然度的信道匹配算法—用以取代EM算法
收藏 IP: 162.156.92.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-28 09:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部