dudong的个人博客分享 http://blog.sciencenet.cn/u/dudong

博文

2013-3-3 假期实验

已有 2590 次阅读 2013-3-3 08:01 |系统分类:科研笔记| 假期

假期在家主要做了几个关于依存句法的实验,用的是条件随机场(CRF),实验是在CRF++软件包的源码基础上修改的。
效果都不太理想

结果分析:
理论方面:用到的是指数家族的表达形式,用来计算P(Y|X)。但是这里涉及到一个分划函数Z的计算,计算Z时需要枚举所有的Y,随着句子长度的增长Y的个数指数爆炸。在实验中我只是用了|Y|^2棵树来近似计算Z,实验效果很不好。
而且在实验时出现了目标函数先减小再增加的情况。最小化目标函数时使用的是L-BFGS算法,正常来讲是不会出现这种情况的。
目测猜测是因为只使用了少量树来近似计算Z造成的。

下一步的计划:
1.继续使用条件随机(CRF)的方法,希望找到其他方法来进行计算。最近读到一些优化方法相关的论文,可以不使用L-BFGS算法来优化,这些或许能避免枚举Z的所有树。
2.使用max-margin方法,也就是结构化SVM方法。这个方法是最近几年才提出来的,传统SVM是用于预测带有标号的数据,但是无法用于预测带有结构的,比如生成树!


https://blog.sciencenet.cn/blog-795431-666635.html

上一篇:依存句法分析
下一篇:2013-3-9 结构化预测(structured prediction)
收藏 IP: 210.30.97.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 11:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部