||
本周做的工作主要是把EGSTRA的源代码看完了,然后自己也写了点代码
用C++写的代码,有点慢。打算这次实验之后开始学习python
本周写的代码主要是关于上下文敏感信息的抽取:
比如一个结点会有多个子结点,这几个子结点按照一定顺序的排列可以看成是这个单词的一个用法,这个结点的 结点以及兄弟结点可以看成这个用法的上下文。
context sensitive rules不仅可以用来做为特征,还可以在inference的时候用。
接下来的计划:
1.把VerbNet的模板信息与上下文敏感信息合并
2.写特征抽取的代码
3.写dual decomposition的代码,这个与特征有很大关系
4.写learning代码,这个比较简单,用averaged perceptron就好了
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 00:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社