科学网

 找回密码
  注册
依存句法分析实验进度
杜东 2013-9-12 14:41
暑假的工作: 把依存句法分析的准确率提高到了92.6%,不过是在Ontonotes 4.0数据集上的 使用的是averaged perceptron算法进行参数学习,结构化SVM最佳情况准确率只有91.6% inference算法也没有使用最开始想用的对偶分解:一个原因是对偶分解速度比较慢,各个子问题之间使用投影梯度下降算法来求解,收敛速度很慢!第二 ...
3476 次阅读|没有评论
依存句法分析实验进度
杜东 2013-7-24 23:34
最近两周又做了几次实验: 之前介绍过,依存句法分析包括三个问题:feature selection, inference, learning feature selection我是在别人的基础上引入了两个新的特征:一个是基于WordNet的特征;一个是基于VerbNet 特征 inference现在已经有现成的框架,理论基础非常好。使用的是对偶分解,把一个复杂难求解的问题 ...
4151 次阅读|没有评论
依存句法分析实验进度
杜东 2013-7-5 09:51
最近实验进度比以前有进步,但仍然不理想,现在准确率最高为81% 7.1号到3号把特征提取部分修改了一下,把WordNet和VerbNet代码中进去。运行特别慢,后来把实验分为5份放在五台机器上进行,然后收集结果合并。。。总共花了两三天时间 实验进展不顺利的容易浮躁,不过也是对心态的磨练,算是好事 接下来要跑几组对 ...
3117 次阅读|没有评论
依存句法实验进度
杜东 2013-6-22 21:59
今天把程序写完了,还没有出结果 在小样本上的最高准确率为87%,还是太低了。。。 接下来准备把它放在服务器上跑一下,看看结果如何 另外就是准备把learning算法替换为ICML 2013年新发的一篇论文中的算法
3338 次阅读|没有评论
依存句法实验进度
杜东 2013-6-15 23:23
看看自己在evernote上记的笔记,虽然每天都有进步,还是感觉时间过的太快了! 实验过程中也出现了几个小问题,导致进度没有赶上预期。。。 问题一:特征过多,现在已经产生了2400万个特征。这么大规模的特征训练起来会非常慢。我自己看了一下产生的特征,发现了可以改进的地方 (1)数词可以合并,许多句子中都包含 ...
3877 次阅读|没有评论
依存句法分析实验进度
杜东 2013-6-1 18:39
本周主要工作是写程序,基本上已经接近尾声 inference算法用的是dual decomposition(这个不会再变了) learning算法用的是averaged perceptron(这个可能还会再变) 没完成的工作包括: (1)写代码的过程比较混乱,所以代码组织很不清晰,类的定义以及功能太乱,准备先把代码组织结构修改一下 (2)调试工作可 ...
3508 次阅读|没有评论
依存句法分析实验进度
杜东 2013-5-25 14:41
本周做的工作主要是把EGSTRA的源代码看完了,然后自己也写了点代码 用C++写的代码,有点慢。打算这次实验之后开始学习python 本周写的代码主要是关于上下文敏感信息的抽取: 比如一个结点会有多个子结点,这几个子结点按照一定顺序的排列可以看成是这个单词的一个用法,这个结点的 结点以及兄弟结点可以看成这个用 ...
3175 次阅读|没有评论
依存句法分析实验进度
杜东 2013-5-18 08:50
说细说一下现在实验的进度吧,主要是实验背景、需要做的工作以及已经完成的工作: 1.实验背景 之前论文都是Penn Treebank上进行的实验,但是这个面要付费。所以我找到另外一个与之非常相似的数据集OntoNotes 4.0。OntoNotes 4.0数据集的目标并不是依存分析,但是Penn Treebank是它的子集(稍有区别)。里边的raw data略 ...
3848 次阅读|没有评论
依存句法分析
杜东 2013-5-7 20:20
最近一周一直在回顾之前的论文,重点放在了graph-based和semi-supervised上边 另外一个关心的问题是如何选择结构化SVM的训练算法 接下来准备收集已有的工具和算法等,先重复一下别人的试验
3261 次阅读|没有评论
依存句法分析
热度 1 杜东 2013-4-29 18:03
最近一周停了一下,把依存句法相关的论文重新读了几篇 发现现在脑子里比较清晰的也只有两三篇而已 这个月快过去了,回顾一下不难看到,重点都放在了偏机器学习的结构化SVM上了 但是依存句法毕竟是机器学习在具体问题上的应用 如果不是做机器学习的话,没有必要花太多精力在这上边,但是反过来说,学习结构化SVM也对 ...
3532 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-25 02:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部