崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

按标题搜索
共现分析的7个瓶颈(7)
2022-2-18 10:34
稿子 投给一些杂志,都被拒了, 放了很多年,经常有人跟我讨论类似的问题,还是有传播的必要,所以我就发到这里。 原先写了7个问题,后来缩减成为6个,标题不好改了,就凑数写了下面的一些感想,应该不算是瓶颈吧。 7.基本疆界的划分 1 书目信息及其分析 书目是图书目录的 ...
个人分类: 科研体会|2470 次阅读|没有评论
共现分析的7个瓶颈(5)
2022-2-18 10:10
5.共现聚类分析中相似性计算的问题 即在聚类分析操作过程中具体的参数选择问题。如图1中的a,b所示,以普遍使用的SPSS软件为例,探讨数据类型、相似系数和类间距离计算方法等参数的选择。 (1) 输入什么类型的数据? 在SPSS系统聚类模块中,重要的是在“方法 ...
个人分类: 科研体会|2185 次阅读|没有评论
共现分析的7个瓶颈(4)
热度 1 2022-2-18 10:06
4.矩阵的使用问题 即把什么矩阵输入到统计分析软件中去的问题。这个问题的出现有其历史原因,笔者猜测,早期从SCI数据库获得矩阵是通过手工操作,如1973年Small最早提出论文同被引的概念并进行了说明 ,在实例操作中,他检索到高被引论文之后,将其两两配对,组合输入到SCI数据库中被引文献检索途径,即可直接获 ...
个人分类: 科研体会|2591 次阅读|1 个评论 热度 1
共现分析的7个瓶颈(3)
2022-2-18 10:00
3 、高频项目截取阈值问题 高频(高被引)条目的截取应当是共现聚类分析各个步骤中最尖锐的问题,至今没有见到明确的答案,但是书目信息共现聚类分析有无法回避这个问题。这是因为实际操作中不可能对抽取出某个字段(如主题词或者作者)的所有条目生成共现矩阵:一来,低频的条目与其他同类条目共现次数少,形成 ...
个人分类: 科研体会|1911 次阅读|没有评论
喜欢做的和必须做的,为什么不能任性呢?
2018-10-22 11:38
本来想继续“憋”那篇英文论文,打开看到一篇参考文献,用PageRank算法计算论文相似性,一直以来有的疑问又涌上心头: PageRank算法不是计算有向无权网络节点的吗?论文相似网络是一个无向加权网络,怎么能用呢? 通过搜索引擎和文献数据库,发现这个算法有个很多改进,通过修改原公式的参数,是可以用到加权 ...
个人分类: 科研体会|2585 次阅读|没有评论
文献计量学投稿中经常遇到的败笔
热度 5 2014-6-11 11:37
已经写了几篇关于投稿审稿的博文了,今天憋不住再唠叨几句。 1. 结论和结果脱节。这是对学科热点前沿进行文献计量分析的论文中最近常看到的,也最让我无奈的问题。从道理上讲, 结论应当来自于对研究结果的分析,但是很多投稿的结论与数据处理后得到的结果风马牛不相干 , 不是对 多维标度、聚类分析和社会网络分 ...
个人分类: 科研体会|19397 次阅读|7 个评论 热度 5
欣喜若狂为哪般
2012-1-4 16:14
科学家素来以冷静著称,著名的例子就是阿基米德在敌人破城之时,依然对着拔刀相向的罗马士兵说:“再给我一点时间,让我证完这条定理”。 当然,科学家也有欣喜若狂的时候。传说中,还是阿基米德,在洗澡时突然想到了在不破坏王冠的情况下来称重的方法,于是乎裸奔上街大呼“我发现了!”,由此诞生了浮力定律。 ...
个人分类: 科研体会|3434 次阅读|没有评论
也许有用(2)
2011-10-4 08:53
这些主要是和医学文本抽取有关的: Condensing biomedical journal texts through paragraph ranking. (PMID:21330292) Mining MEDLINE for the Treatment of Osteoporosis. (PMID:21494854) Automated extraction of radiation dose information from CT dose report images. ...
个人分类: 科研体会|3693 次阅读|没有评论

本页有 2 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-17 04:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部