huanglanqi711的个人博客分享 http://blog.sciencenet.cn/u/huanglanqi711

博文

事件建模与挖掘相关资料(四)

已有 1302 次阅读 2023-2-25 11:14 |个人分类:科研笔记|系统分类:科研笔记

EC模型的理论

一、立方体内操作

1.1 roll-up向上归纳

向上归纳是通过概念层次结构向上遍历完成的,其中概念层结构将一组低级概念映射到高级。Roll-up被形式化为: Ru(Qe,E-Cube,Hk,L,M):RE,其中RE是操作返回的结果事件,Qe是起始事件或者查询事件的集合,E-Cube是被操作的事件立方体,Hk是来自H的元素级或者事件级层次结构,L是绝对或者相对模式M中的目标层次。

1.2 drill-down下钻

与roll-up作用相反,通过遍历层次结构来获取更多细节,从而提供更加具体和详细的事件立方体视图,表示为Dd(Qe,E-Cube,Hk,L,M):RE

1.3 slice切片

形式化为Sl(E-Cube,Ai-Ci):RE-Cube,E-Cube其中是操作返回的结果的事件立方体,Ci给出Ai需要满足的条件

1.4 dice 切成方块

基于多个维度选择事件,形式化为Di(E-cube,{Ai-Ci):RE-Cube,与Slice类似,但规定了多个维度上的条件。

1.5 pivot旋转

排列对事件立方体进行维度和重塑,以显示相应的兴趣视图,公式化为Pivot(E-Cube,Ai,Aj,Ak):RE-Cube,其中Ai,Aj,Ak是可视化的三个主要兴趣维度。

1.6 x-validate X验证

通过交叉检查相关事件的多个维度来进行立方体内事件的验证,例如,检查事件元素的一致性并沿着概念层次结构填充缺失值(信息补全)。 x-validate公式为Xv(E-Cube,e,Ai,{Hk}):Re,其中目标事件e的Ai维将根据参考的概念层次结构{Hk]进行确认,从而得到确认的事件Re。例如,Xv(E-Cube,e,A1,{He}):Re,基于He(即事件级层次结构)检查事件e的A1维(即,当时)。该操作首先检查e在A1维度上是否与其沿He的父子事件一致。如果A1的值缺失,则根据父子事件的A1维度进行估计。

二、立方体间操作

2.1 union合并

Union将两个事件立方体中的任一事件进行重组,形式化为Un(E-Cube1,E-Cube2,[{Ai}]):RE-Cube,RE-Cube是通过合并E-Cube1或E-Cube2中的事件得到的事件立方体,[{Ai}]是可选的,用于指定事件考虑的维度。默认[{Ai}]为事件的所有维度。

2.2 intersect相交

对两个事件立方体的底层事件进行重新组织,形式化为In( E-Cube1,E-Cube2,[{Ai}]):RE-Cube,句法上类似于Union

2.3 subtract相减

减法保留了两个立方体之间的差集,形式化为Sb(E-Cube1,E-Cube2,[Ai]):RE-Cube,在句法上类似于Union

2.4 scoping取整

为一个事件立方体的查询事件的限制范围内,从另一个事件立方体中检索事件,形式化为Sc(e,E-Cube1,E-Cube2,{Ai-Ci}):RE-Cube,其中e是E-Cube1中的查询事件,E-Cube2是用于检索的目标事件立方体。{Ai-Ci}是可能的维度约束,RE-Cube是得到的事件立方体,是E-Cube2的子立方体。例如,Sc('2015天津爆炸',E-Cubel,E-Cube2,{时间=2015年8月,地点="天津}):RE-Cube从E-Cube2中检索到与E-Cubel的"2015天津爆炸事件"相关的事件,即E-Cube2中的事件同时发生在天津。

三、EC模型的OLAP处理

3.1立方体内的事件关系分析

多维事件是单维事件的集合,可以针对单维事件下定义再研究多维事件。单维事件关系分析定义为两个事件在特定维度上关于给定相似性度量的相似度,具体如下:

定义一:定义两个事件ei和ej,i≠j,定义ei和ej在维度k上的关系程度为image.png,其中Simk(,)是在k维度的相似度计量

因此,对于每个维度,需要一个相似性度量来计算两个事件之间的关系。考虑到可能存在不止一种关系,允许采用多种相似性度量。在下文中,我们为定义的维度提出所需的相似性度量,即何时、何地、谁和什么。

when:两个事件之间时间相似度计算公式:其中,Z为归一化处理,μ控制测量的灵敏度,时间顺序由结果的符号保持。

image.png

where:两个事件之间空间相似度通过球面三角半正矢公式定义:

image.png


3.2立方体间的事件关系分析





https://blog.sciencenet.cn/blog-3549363-1377868.html

上一篇:信息检索学习资料(一)
下一篇:日常感悟
收藏 IP: 1.202.114.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-27 11:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部