许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

数据库文献的主题标引问题

已有 1259 次阅读 2017-8-29 10:17 |个人分类:知识组织|系统分类:科研笔记

我从1978年参加工作就做文献标引工作,至今很多标引问题并没有深刻的认识和解决好方法。

       数据库文献的主题标引质量十分重要,计算机辅助标引,自动抽取文本词并转换成主题词,有些主题概念不准确,会产生歧义,造成文献误检索,影响检索系统的查全率和查准率。

       自动标引的最主要问题是主题概念歧义,不能表达事物的实质内容。因此,需要标引专家对标引结果进行严格审核。

我们来看几个标引实例:

<检索词>=海啸

<题名>=基于分布式和协同波束形成算法的自组织无线传感器网络

<作者关键词>=分布式和协同波束形成;;自定位;;相控阵;;无线传感器网络(WSN)

<摘要>=文章所考虑的方案是如何让无线传感器网络(WSN)中的传感器把被监视的数据处理、传输到远端的收集器上;远端的收集器可能是已经部署好了的WSNs上收集数据的基地站(BS),如用于地震,海啸,或污染监测等;文章分析使用了分布式和协同波束形成技术(DC-BMF),这一技术把节点作为一个相控阵上的元素,在每个天线节点信号的阶段,元素线性组合以调整整个阵列的定向增益。

<主题词>=相控阵;;协同;;基地站;;文章;;

鲜乳收集;;  文中看不出有鲜乳,这个词串标引不合适。

档案收集;;数据处理;;传感器;;元素;;节点;;海啸;;软切换;;


<检索词>=动态数据库

<题名>=基于停留时间的语义行为模式挖掘

<作者关键词>=语义轨迹;;停留时间;;语义行为模式;;模式相似度;;移动对象聚类

<摘要>=移动对象的语义行为模式挖掘是当前移动对象研究中关注的热点,有益于诸多应用场景,如朋友推荐系统、轨迹破案领域和个性化服务等.目前语义行为模式挖掘方法没有考虑移动对象在停留点的停留时间,不能准确地分辨出移动对象之间的不同行为模式.为了解决上述问题,提出了一种基于停留时间的语义行为模式挖掘(discovering common behavior using staying duration on semantic trajectory,DSTra)方法,首先挖掘每个移动对象的频繁语义行为模式,然后定义语义行为模式之间的相似性度量方法,最后采用层次聚类的方法对移动对象进行聚类,找出具有相似行为模式的移动对象群体.实验结果表明:该方法不仅具有合理性和有效性,同时还具有较高的准确率和较好的效率.

<主题词>=行为模式;;

朋友;;  词表是如何定义  朋友? 应该用于人的朋友

安全性约束;;递归查询;;动态查询;;动态数据库;;分层模型;;关系模型;;逻辑数据库;;树形结构;;数据采集系统;;数据独立性;;

<分类号>=TP311.13

<文本词>=语义行为模式;;停留时间;;移动对象;;移动对象聚类;;模式相似度;;挖掘;;语义轨迹;;行为模式;;基于;;挖掘方法;;推荐系统;;应用场景;;个性化服务;;相似性度量;;层次聚类;;com;;DST;;准确率;;停留;;朋友;;


<检索词>=计算机网络计算机安全

<题名>=计算机网络入侵环境下健康节点通信选择算法的研究与仿真

<作者关键词>=网络入侵环境;;健康节点;;通信;;选择

<摘要>=提出一种新的网络入侵环境下健康节点通信选择算法,依据网络入侵数据的特点,引入统计学中分类思想实现网络入侵数据的检测.在此基础上,给出健康节点通信失真表达式,采用最靠近信源的健康节点通信选择方法,使其他节点进入休眠模式,并对失真情况进行分析.选择一定范围内的健康节点进行数据传输,依据计算结果与失真误差要求对范围进行划定,从而实现健康节点通信选择.实验结果表明,所提算法不仅失真性低,能够保持传输信息的完整性和通信安全,而且所需能耗低,通信效率高.

<主题词>=

健康;;  应该用于人类或动物的身体健康

计算机;;选择;;失真;;仿真;;通信;;统计学;;通信安全;;数据传输;;实时检测;;网络保护;;计算机网络计算机安全;;

<分类号>=TP393.08

<文本词>=网络入侵环境;;节点通信;;健康节点;;选择算法;;健康;;网络入侵;;计算机;;选择;;失真;;仿真;;通信;;分类思想;;休眠模式;;选择方法;;依据;;统计学;;研究;;通信安全;;通信效率;;数据传输;;




http://blog.sciencenet.cn/blog-280034-1073225.html

上一篇:书法习作 216 名人名言
下一篇:许培扬书法作品 进入中国第八届书画大赛前20名

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-3-29 03:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部