||
本周主要工作是写程序,基本上已经接近尾声
inference算法用的是dual decomposition(这个不会再变了)
learning算法用的是averaged perceptron(这个可能还会再变)
没完成的工作包括:
(1)写代码的过程比较混乱,所以代码组织很不清晰,类的定义以及功能太乱,准备先把代码组织结构修改一下
(2)调试工作可能会比较费时间。上周写的程序都调试过了,但是本周写的有点快,也有点乱
(3)文件读写工作:里边涉及以很多预处理工作,而且在inference算法和learning算法中也涉及到许多与算法无关的细节工作。每次运行都会花很多时间。之前调试程序的麻烦是每次要等将近5分钟才遇到bug出现。所以打算把已经调试过没有问题的结果暂时保存到文件中,这样就可以省去大量的调试时间
潜在的问题:
正常来讲要用的数据集是WSJ,但是那个需要花钱买。如果有这个数据集的话,就只需要运行自己的算法,与别人的现有结果比较即可。
但是现在用的是另外一个略不同的数据集Ontonotes 4.0。所以一直在联系要比较算法的那几个作者,希望把他们的实验在新数据集上比较一下。。。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 07:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社