科学网

 找回密码
  注册
AI在公共卫生领域都能做什么
崔雷 2022-3-21 12:00
卫生保健:对监测数据进行几乎实时的模式分析,发现疾病,例如利用谷歌搜索引擎和GPS定位信息预测引起食源性疾病的餐馆。【 Machine-learned epidemiology: real-time detection of foodborne illness at scale | npj Digital Medicine (nature.com) 】 健康促进:根据个人危险谱和行为模式,提出有针对性的个性化健 ...
个人分类: 智慧健康|1326 次阅读|没有评论
喜大普奔:课程视频上线了!
崔雷 2022-3-1 17:16
生物医学数据库利用和文本挖掘在科研选题中应用两门课已上线,以下是课程连接: 生物医学数据库利用 https://www.xuetangx.com/course/CMUP1010006416/11685268?channel=i.area.manual_search 文本挖掘在科研选题中应用 https://www.xuetangx.com/course/CMUP1010006417/11685217?channel=i.area.manual_search
个人分类: 生物医学文本挖掘|1390 次阅读|没有评论
共现分析的7个瓶颈(7)
崔雷 2022-2-18 10:34
稿子 投给一些杂志,都被拒了, 放了很多年,经常有人跟我讨论类似的问题,还是有传播的必要,所以我就发到这里。 原先写了7个问题,后来缩减成为6个,标题不好改了,就凑数写了下面的一些感想,应该不算是瓶颈吧。 7.基本疆界的划分 1 书目信息及其分析 书目是图书目录的 ...
个人分类: 科研体会|1526 次阅读|没有评论
共现分析的7个瓶颈(6)
崔雷 2022-2-18 10:16
6 聚类含义的解释 共现聚类分析的诸多关键节点中,对于聚类分析结果的语义判读和解释是整个分析研究的最后一道程序。聚类结果经过解读后把所研究的领域研究热点等直接呈现给用户,因此解读是否准确和可靠决定着整个分析的成败;而结果的准确和可靠程度受制于分析者的专业知识背景和逻 ...
个人分类: 生物医学文本挖掘|1056 次阅读|没有评论
共现分析的7个瓶颈(5)
崔雷 2022-2-18 10:10
5.共现聚类分析中相似性计算的问题 即在聚类分析操作过程中具体的参数选择问题。如图1中的a,b所示,以普遍使用的SPSS软件为例,探讨数据类型、相似系数和类间距离计算方法等参数的选择。 (1) 输入什么类型的数据? 在SPSS系统聚类模块中,重要的是在“方法 ...
个人分类: 科研体会|1208 次阅读|没有评论
共现分析的7个瓶颈(4)
热度 1 崔雷 2022-2-18 10:06
4.矩阵的使用问题 即把什么矩阵输入到统计分析软件中去的问题。这个问题的出现有其历史原因,笔者猜测,早期从SCI数据库获得矩阵是通过手工操作,如1973年Small最早提出论文同被引的概念并进行了说明 ,在实例操作中,他检索到高被引论文之后,将其两两配对,组合输入到SCI数据库中被引文献检索途径,即可直接获 ...
个人分类: 科研体会|1224 次阅读|1 个评论 热度 1
共现分析的7个瓶颈(3)
崔雷 2022-2-18 10:00
3 、高频项目截取阈值问题 高频(高被引)条目的截取应当是共现聚类分析各个步骤中最尖锐的问题,至今没有见到明确的答案,但是书目信息共现聚类分析有无法回避这个问题。这是因为实际操作中不可能对抽取出某个字段(如主题词或者作者)的所有条目生成共现矩阵:一来,低频的条目与其他同类条目共现次数少,形成 ...
个人分类: 科研体会|1031 次阅读|没有评论
共现分析的7个瓶颈(2)
崔雷 2022-2-18 09:58
2 、频次统计 书目共现聚类分析中,条目出现频次是最基本的数据,也是截取高频条目以及共现分析的基础,研究者一般直接将文献记录输入到已有的软件(如citespace、bicomb)中,直接得到书目文献记录中的各字段(如作者、主题词等)中条目的出现频次,但是这种频数统计实际上也隐藏着差异。 (1)引用频次的统 ...
个人分类: 生物医学文本挖掘|1220 次阅读|没有评论
共现分析的7个瓶颈(1)
崔雷 2022-2-18 09:52
1 、共词聚类分析样本的收集 分析样本的收集是开展后续研究的基础。显然,对于特定的领域研究状况的分析,如果样本采集出现错误,或者收集不全,或者误检率过高,那么无论其后的分析过程多么严谨,所得到的结论都是不可信的。 对于书目信息的共现分析,涉及到的主要问题就是在文献数据库中如何制定检索策略的问 ...
个人分类: 生物医学文本挖掘|1031 次阅读|没有评论
Bicomb又有一个bug“非有效整数值”
热度 1 崔雷 2021-10-9 09:28
“is not a valid integer value”,一般在处理SCI下载数据出现,是因为SCI数据库文献记录格式有个小变动,使得提取文章编号的时候出现了问题。所以说,依赖于现成的软件(如Bicomb)还是受制于人的,还是扔掉拐杖,自己行走甚至飞奔才能自由。 修改的补丁如下: yxwxgx.exe 如果有问题请留言,近期我将多关注这个博 ...
个人分类: Bicomb|1813 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2023-3-27 16:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部