最近还在忙实验的事Penn Treebank II的处理代码已经写完了
因为数据集的格式比较复杂,处理起来比较麻烦
接下来的工作是这样的:
1.把以前关于概率图模型(PGM)相关的论文再读一下,思考下inference和learning的方法
2.写代码
概率图模型是最近特别火的一种机器学习方法,主要包含表示(representation)、推理(inference)和学习(learning)三部分。
最近的主题模型主要是用LDA及其变种
概率图模型方面的论文大致可以分为两大类:
1.概率图模型的理论研究,主要是发表在ICML上的,一般是机器学习圈子里的人在做,主要是研究如何使概率图模型的计算速度更快、准确率更高
2.概率图模型的应用:这个就很多了,自然语言处理、生物信息计算(蛋白质序列分析、基因检测等)等
https://blog.sciencenet.cn/blog-795431-628971.html
上一篇:
实验下一篇:
reading list