数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

事件抽取——“大数据与智能决策”讨论班

已有 797 次阅读 2019-9-25 16:09 |个人分类:科研笔记|系统分类:科研笔记| 事件抽取

  9月24日晚上,“糖果之家”相约星期二,“大数据与智能决策”讨论班(Seminar)继续开讲,本次讨论班以“时空周期模式挖掘”和“事件抽取”为题,共讨论了两篇文献,由两名博士生进行讲解,共有青年教师、博士后、博士生和硕士生19人参加,以下是“事件抽取”内容简介及文献信息。

事件抽取

    随着互联网信息的快速增长,从非结构化的信息中获取知识描述知识越发重要。事件抽取是一种自动化信息抽取方式,它能够是从非结构化信息中识别出事件,以及事件相关的元素常见的有时间、地点等。

    传统的事件抽取方法大多基于管道模型,存在错误传播的根本问题。随着计算能力的提升,联合模型成为事件抽取方法的一个热点研究方向。早期的事件抽取是句子级的抽取,忽略了上下文信息。基于文档的事件抽取能够充分利用上下文信息,提高事件抽取效果。

    事件抽取的定义:从描述事件信息的文本中抽取出用户感兴趣的事件并以结构化的形式呈现出来。事件抽取的步骤:首先识别出事件及其类型,其次要识别出事件所涉及的元素(一般是实体),最后需要确定每个元素在事件中所扮演的角色。每个事件类型都有一个模板,下图列举了一些事件类型的模板。

    文献:Yang B, Mitchell T. Joint Extraction of Events and Entities within a Document Context[C]. HLT- NAACL, San Diego, 2016, Association Linguistics Computational: 289-299.

 以单篇文档为单位,综合考虑了事件内部触发词、事件元素及实体的相互影响,文档范围内事件与事件间的依赖和共现关系。作者首先将事件与实体抽取问题划分为3个可计算可处理的子问题,并分别对每个子问题建立概率模型。各子问题描述如下:(1)从单一事件出发,考虑事件内部事件触发词、语义角色和实体及相互的关系;(2)从单一文档出发,考虑事件与事件之间的依赖和共现关系;(3)命名实体的抽取。再通过一个联合优化模型将各个概率模型组合起来,训练得到全局最优解。论文采用了ACE语料库进行实验,实验结果分别与传统基于最大熵的管道模型,基于集束搜索的联合模型,单纯考虑事件内部触发词、元素和实体模型结果在准确率、召回率和F1值上进行比较。实验结果表明,论文提出的统一联合模型具有更好的效果。

事件抽取能够有效促进各类实践应用,现已经在知识库构建,自动文摘,自动问答,信息检索等领域有着广泛的应用。





http://blog.sciencenet.cn/blog-34250-1199435.html

上一篇:时空周期模式挖掘——“大数据与智能决策”讨论班
下一篇:教育数据挖掘——“大数据与智能决策”讨论班

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-11-15 00:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部