||
EC模型的理论
一、立方体内操作
1.1 roll-up向上归纳
向上归纳是通过概念层次结构向上遍历完成的,其中概念层结构将一组低级概念映射到高级。Roll-up被形式化为: Ru(Qe,E-Cube,Hk,L,M):RE,其中RE是操作返回的结果事件,Qe是起始事件或者查询事件的集合,E-Cube是被操作的事件立方体,Hk是来自H的元素级或者事件级层次结构,L是绝对或者相对模式M中的目标层次。
1.2 drill-down下钻
与roll-up作用相反,通过遍历层次结构来获取更多细节,从而提供更加具体和详细的事件立方体视图,表示为Dd(Qe,E-Cube,Hk,L,M):RE
1.3 slice切片
形式化为Sl(E-Cube,Ai-Ci):RE-Cube,E-Cube其中是操作返回的结果的事件立方体,Ci给出Ai需要满足的条件
1.4 dice 切成方块
基于多个维度选择事件,形式化为Di(E-cube,{Ai-Ci):RE-Cube,与Slice类似,但规定了多个维度上的条件。
1.5 pivot旋转
排列对事件立方体进行维度和重塑,以显示相应的兴趣视图,公式化为Pivot(E-Cube,Ai,Aj,Ak):RE-Cube,其中Ai,Aj,Ak是可视化的三个主要兴趣维度。
1.6 x-validate X验证
通过交叉检查相关事件的多个维度来进行立方体内事件的验证,例如,检查事件元素的一致性并沿着概念层次结构填充缺失值(信息补全)。 x-validate公式为Xv(E-Cube,e,Ai,{Hk}):Re,其中目标事件e的Ai维将根据参考的概念层次结构{Hk]进行确认,从而得到确认的事件Re。例如,Xv(E-Cube,e,A1,{He}):Re,基于He(即事件级层次结构)检查事件e的A1维(即,当时)。该操作首先检查e在A1维度上是否与其沿He的父子事件一致。如果A1的值缺失,则根据父子事件的A1维度进行估计。
二、立方体间操作
2.1 union合并
Union将两个事件立方体中的任一事件进行重组,形式化为Un(E-Cube1,E-Cube2,[{Ai}]):RE-Cube,RE-Cube是通过合并E-Cube1或E-Cube2中的事件得到的事件立方体,[{Ai}]是可选的,用于指定事件考虑的维度。默认[{Ai}]为事件的所有维度。
2.2 intersect相交
对两个事件立方体的底层事件进行重新组织,形式化为In( E-Cube1,E-Cube2,[{Ai}]):RE-Cube,句法上类似于Union
2.3 subtract相减
减法保留了两个立方体之间的差集,形式化为Sb(E-Cube1,E-Cube2,[Ai]):RE-Cube,在句法上类似于Union
2.4 scoping取整
为一个事件立方体的查询事件的限制范围内,从另一个事件立方体中检索事件,形式化为Sc(e,E-Cube1,E-Cube2,{Ai-Ci}):RE-Cube,其中e是E-Cube1中的查询事件,E-Cube2是用于检索的目标事件立方体。{Ai-Ci}是可能的维度约束,RE-Cube是得到的事件立方体,是E-Cube2的子立方体。例如,Sc('2015天津爆炸',E-Cubel,E-Cube2,{时间=2015年8月,地点="天津}):RE-Cube从E-Cube2中检索到与E-Cubel的"2015天津爆炸事件"相关的事件,即E-Cube2中的事件同时发生在天津。
三、EC模型的OLAP处理
3.1立方体内的事件关系分析
多维事件是单维事件的集合,可以针对单维事件下定义再研究多维事件。单维事件关系分析定义为两个事件在特定维度上关于给定相似性度量的相似度,具体如下:
定义一:定义两个事件ei和ej,i≠j,定义ei和ej在维度k上的关系程度为,其中Simk(,)是在k维度的相似度计量
因此,对于每个维度,需要一个相似性度量来计算两个事件之间的关系。考虑到可能存在不止一种关系,允许采用多种相似性度量。在下文中,我们为定义的维度提出所需的相似性度量,即何时、何地、谁和什么。
when:两个事件之间时间相似度计算公式:其中,Z为归一化处理,μ控制测量的灵敏度,时间顺序由结果的符号保持。
where:两个事件之间空间相似度通过球面三角半正矢公式定义:
3.2立方体间的事件关系分析
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 03:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社