||
我从1978年参加工作就做文献标引工作,至今很多标引问题并没有深刻的认识和解决好方法。
数据库文献的主题标引质量十分重要,计算机辅助标引,自动抽取文本词并转换成主题词,有些主题概念不准确,会产生歧义,造成文献误检索,影响检索系统的查全率和查准率。
自动标引的最主要问题是主题概念歧义,不能表达事物的实质内容。因此,需要标引专家对标引结果进行严格审核。
我们来看几个标引实例:
<检索词>=海啸
<题名>=基于分布式和协同波束形成算法的自组织无线传感器网络
<作者关键词>=分布式和协同波束形成;;自定位;;相控阵;;无线传感器网络(WSN)
<摘要>=文章所考虑的方案是如何让无线传感器网络(WSN)中的传感器把被监视的数据处理、传输到远端的收集器上;远端的收集器可能是已经部署好了的WSNs上收集数据的基地站(BS),如用于地震,海啸,或污染监测等;文章分析使用了分布式和协同波束形成技术(DC-BMF),这一技术把节点作为一个相控阵上的元素,在每个天线节点信号的阶段,元素线性组合以调整整个阵列的定向增益。
<主题词>=相控阵;;协同;;基地站;;文章;;
鲜乳收集;; 文中看不出有鲜乳,这个词串标引不合适。
档案收集;;数据处理;;传感器;;元素;;节点;;海啸;;软切换;;
<检索词>=动态数据库
<题名>=基于停留时间的语义行为模式挖掘
<作者关键词>=语义轨迹;;停留时间;;语义行为模式;;模式相似度;;移动对象聚类
<摘要>=移动对象的语义行为模式挖掘是当前移动对象研究中关注的热点,有益于诸多应用场景,如朋友推荐系统、轨迹破案领域和个性化服务等.目前语义行为模式挖掘方法没有考虑移动对象在停留点的停留时间,不能准确地分辨出移动对象之间的不同行为模式.为了解决上述问题,提出了一种基于停留时间的语义行为模式挖掘(discovering common behavior using staying duration on semantic trajectory,DSTra)方法,首先挖掘每个移动对象的频繁语义行为模式,然后定义语义行为模式之间的相似性度量方法,最后采用层次聚类的方法对移动对象进行聚类,找出具有相似行为模式的移动对象群体.实验结果表明:该方法不仅具有合理性和有效性,同时还具有较高的准确率和较好的效率.
<主题词>=行为模式;;
朋友;; 词表是如何定义 朋友? 应该用于人的朋友
安全性约束;;递归查询;;动态查询;;动态数据库;;分层模型;;关系模型;;逻辑数据库;;树形结构;;数据采集系统;;数据独立性;;
<分类号>=TP311.13
<文本词>=语义行为模式;;停留时间;;移动对象;;移动对象聚类;;模式相似度;;挖掘;;语义轨迹;;行为模式;;基于;;挖掘方法;;推荐系统;;应用场景;;个性化服务;;相似性度量;;层次聚类;;com;;DST;;准确率;;停留;;朋友;;
<检索词>=计算机网络计算机安全
<题名>=计算机网络入侵环境下健康节点通信选择算法的研究与仿真
<作者关键词>=网络入侵环境;;健康节点;;通信;;选择
<摘要>=提出一种新的网络入侵环境下健康节点通信选择算法,依据网络入侵数据的特点,引入统计学中分类思想实现网络入侵数据的检测.在此基础上,给出健康节点通信失真表达式,采用最靠近信源的健康节点通信选择方法,使其他节点进入休眠模式,并对失真情况进行分析.选择一定范围内的健康节点进行数据传输,依据计算结果与失真误差要求对范围进行划定,从而实现健康节点通信选择.实验结果表明,所提算法不仅失真性低,能够保持传输信息的完整性和通信安全,而且所需能耗低,通信效率高.
<主题词>=
健康;; 应该用于人类或动物的身体健康
计算机;;选择;;失真;;仿真;;通信;;统计学;;通信安全;;数据传输;;实时检测;;网络保护;;计算机网络计算机安全;;
<分类号>=TP393.08
<文本词>=网络入侵环境;;节点通信;;健康节点;;选择算法;;健康;;网络入侵;;计算机;;选择;;失真;;仿真;;通信;;分类思想;;休眠模式;;选择方法;;依据;;统计学;;研究;;通信安全;;通信效率;;数据传输;;
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 17:48
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社