wuxiaolananhui的个人博客分享 http://blog.sciencenet.cn/u/wuxiaolananhui

博文

听芮勇博士报告《From Big data Knowledge Minining》

已有 3724 次阅读 2015-1-9 09:42 |系统分类:科研笔记| Big, Data, Graph, 微软亚洲研究院, entity

时间:  2015年1月8日  地点:南大仙林计算机楼233
  首先芮博士跟我们大家介绍了一些微软研究院情况,现有微软研究院全球约10万人,其中研究员约1千左右,提到了微软研究员一些有名的人物:前印度研究员院长 Anadon,图灵奖得主Leslie Lamport,亚洲研究院研究员 张林涛、许峰雄等。另外谈到了一些微软研究员联合培养的 Jun Zhu(清华)、获得“微软学者”称号的周志华老师。
其次,芮博士讲述了一个entity graph 的学术内容。大数据通常具有4V(Volume、Velocity、Variety、Veracity),芮博士提出了另个一个V(Value),要想实现这个Value,需要有knowledge mining ,从各类无结构或半结构中挖掘出知识,获得Intelligence,为此芮博士从knowledge 定义(给出了如ontology,实体与类别、属性等8个方面去定义知识),并为此提出了一个knowledge mining 的framework和二个技术entity Mining、entity Linking)。其中,entity Mining技术谈到了Multi-Round Facts extraction(与我们通常读百遍书过程类似,先遇到不懂的不要紧,继续读,但是能识别出名词性词组、时间性词等这个基本的句子组成部分,然后结合已有知识库中将这些知识碎片慢慢理解),entity Linking主要指依据上下文来读,慢慢将知识碎片链接起来,形成一个大的知识网。

 



https://blog.sciencenet.cn/blog-668239-857697.html

上一篇:第三届全国社会媒体处理大会总结
下一篇:请教: 自然科学基金委分类号与哪个分类法体系最为接近?
收藏 IP: 112.4.49.*| 热度|

2 章成志 刘桂锋

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 13:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部