dudong的个人博客分享 http://blog.sciencenet.cn/u/dudong

博文

依存句法分析实验进度

已有 3565 次阅读 2013-6-1 18:39 |系统分类:科研笔记| 进度

本周主要工作是写程序,基本上已经接近尾声

inference算法用的是dual decomposition(这个不会再变了)

learning算法用的是averaged perceptron(这个可能还会再变)



没完成的工作包括:

(1)写代码的过程比较混乱,所以代码组织很不清晰,类的定义以及功能太乱,准备先把代码组织结构修改一下

(2)调试工作可能会比较费时间。上周写的程序都调试过了,但是本周写的有点快,也有点乱

(3)文件读写工作:里边涉及以很多预处理工作,而且在inference算法和learning算法中也涉及到许多与算法无关的细节工作。每次运行都会花很多时间。之前调试程序的麻烦是每次要等将近5分钟才遇到bug出现。所以打算把已经调试过没有问题的结果暂时保存到文件中,这样就可以省去大量的调试时间


潜在的问题:

正常来讲要用的数据集是WSJ,但是那个需要花钱买。如果有这个数据集的话,就只需要运行自己的算法,与别人的现有结果比较即可。

但是现在用的是另外一个略不同的数据集Ontonotes 4.0。所以一直在联系要比较算法的那几个作者,希望把他们的实验在新数据集上比较一下。。。



https://blog.sciencenet.cn/blog-795431-695674.html

上一篇:依存句法分析实验进度
下一篇:依存句法实验进度
收藏 IP: 210.30.97.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 22:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部