||
文献数据库的几个老问题,国内的数据库都缺少研究,需要加强。
文献标引的一致性研究
文献标引质量对检索效率的影响
词表对文献标引和检索的影响
文献标引深度对检索效率的影响
中文主题的自动抽取问题
关键词与主题词的自动转换问题
主题词与分类号的自动转换问题
中国知网的中国医院知识仓库CHKD 做的很好,从2002年以来,一直有很强的研究团队、有几名文献标引和检索专家指导,对数据库质量把关。每年有几次数据库标引质量的检测评估,有一套标引质量评价指标和方法。词表体系非常强大,每年更新及时。
【检索词】朗格汉斯细胞肉瘤
【主题词词类】
【文件名】ZDBL200506011
【题名】淋巴结指突状树突细胞肉瘤临床病理观察
【年】2005
【作者】张哉根,叶明福,刁鑫伟,陈锐,王亚丽,汤金梁
【关键词】淋巴结肿瘤;;指突状树突细胞肉瘤;;诊断;;免疫组化;;电镜
【中文摘要】目的探讨淋巴结原发性指突状树突细胞肉瘤的临床病理特点及鉴别诊断,提高对该肿瘤的诊断水平。方法对2例指突细胞肉瘤进行组织病理学、免疫组化及电镜观察。结果2例肿瘤均位于颈部淋巴结,光镜检查肿瘤组织呈席纹状、旋涡状或杂乱排列,瘤细胞卵圆形、梭形,胞质少,核卵圆形或短梭形,染色质细,少数有核仁,分裂象多见。瘤细胞S-100、CD68及vimentin(+),CD21、CD34、CK、CD45、SMA及HMB45均(-)。电镜下瘤细胞胞质有大量长指状突起,无桥粒连接及Birbeck颗粒。结论指突状树突细胞肉瘤是一种罕见的恶性肿瘤,预后差。诊断主要依靠电镜及免疫组化,并应与滤泡树突细胞肉瘤、朗格汉斯细胞肉瘤、恶性纤维组织细胞瘤、黑色素瘤、梭形细胞癌及其他肉瘤鉴别。
【M全部主题词总数】10
【M全部主题词】淋巴结;;病理学, 临床;;免疫组织化学;;显微镜检查, 电子;;朗格汉斯细胞肉瘤;;树突状细胞肉瘤, 滤泡;;组织细胞瘤, 恶性纤维;;诊断, 鉴别;;黑色素瘤;;有丝分裂;;
【M中文文本词总数】16
【M中文文本词】淋巴结;;免疫组化;;临床病理;;朗格汉斯细胞肉瘤;;滤泡树突细胞肉瘤;;临床病理特点;;其他肉瘤;;恶性纤维组织细胞瘤;;电镜观察;;电镜;;鉴别诊断;;黑色素瘤;;原发性;;分裂象;;肿瘤;;肉瘤;;
【M主题词相关词总数】2
【M主题词相关词】组织病理学;;梭形细胞癌;;
【MICD专用词总数】2
【MICD专用词】指突状树突细胞肉瘤;;瘤细胞;;
【机构】第三军医大学新桥医院病理科,第三军医大学新桥医院病理科,第三军医大学新桥医院病理科,第三军医大学新桥医院病理科,第三军医大学新桥医院病理科,第三军医大学新桥医院病理科 重庆400037,重庆400037,重庆400037,重庆400037,重庆400037,重庆400037
【文献出处】诊断病理学杂志
与徐总的讨论:
医信天下徐立水:
你提的几个课题我大致知道,只是这个应该国家掏钱研究
许培扬 北京:
国家不支持的 万方 知网 也没有多少研究
许培扬 北京:
数据处理的老问题
许培扬 北京:
中国没有多少研究成果
许培扬 北京:
中文的自动标引 没有解决
许培扬 北京:
语言太复杂
医信天下徐立水:
常用汉字只不过2000多个,做起来不复杂
医信天下徐立水:
加上自由组合、成语和短语也是可以规范的
医信天下徐立水:
国家科技顶层设计的不懂
许培扬 北京:
自动标引概念歧义 的很多
许培扬 北京:
我们都是人工干预的 纠正歧义
医信天下徐立水:
是的
许培扬 北京:
美 国会 打伊拉克的决定
许培扬 北京:
你看 切词 不同 意思就不一样
许培扬 北京:
美国 会大伊拉克
许培扬 北京:
美国会 有两个含义
许培扬 北京:
这样 问题很多的
许培扬 北京:
医学语言更复杂
医信天下徐立水:
是
医信天下徐立水:
这些实实在在存在
许培扬 北京:
西文就不一样 一般没有歧义
许培扬 北京:
中文一词多义 隐含概念多 很复杂的
医信天下徐立水:
明喻 借喻 暗喻 等等是吧
许培扬 北京:
是的
许培扬 北京:
比如 中医的气血 阴阳
医信天下徐立水:
这个方面您觉得有什么好办法吗
许培扬 北京:
计算机自动标引解决不了
许培扬 北京:
需要人工干预
许培扬 北京:
对主题概念限定 明确定义
医信天下徐立水:
主题限定不容易吧
许培扬 北京:
文献中主题的重要程度 计算机也处理不了
医信天下徐立水:
您指的主题词限定还是文章论文内容限定
许培扬 北京:
现在是计算词的次数 给予权重
许培扬 北京:
其实不准确的
许培扬 北京:
对主题概念的限定 比如什么是中医的 气
许培扬 北京:
对主题概念的限定 比如什么是中医的 气
医信天下徐立水:
这个不容易
许培扬 北京:
是啊
许培扬 北京:
因此 中文的自动标引太难啦
医信天下徐立水:
我到有一些思考
许培扬 北京:
好的
医信天下徐立水:
例如 论文不能写作超过2000字等等 ,超过2000字不能超过几个关键词
许培扬 北京:
日本 台湾 澳大利亚 等国家80年代大力研究 没有找到好方法
许培扬 北京:
关键词多少没有关系的
医信天下徐立水:
是研究内容
医信天下徐立水:
也是思考不成熟
医信天下徐立水:
没有很成熟哦
医信天下徐立水:
过去开过主题词培训 现在没有了
许培扬 北京:
你们可以研究
许培扬 北京:
是的
医信天下徐立水:
我们标引只不过更精确
许培扬 北京:
美国MEDLINE 数据库一直是人工标引
医信天下徐立水:
那需要多少人啊
许培扬 北京:
采用了计算机标引系统 联机标引
许培扬 北京:
是的 人力多 费用高
医信天下徐立水:
怎么个联机方法
许培扬 北京:
但数据库质量好 检索效率高
许培扬 北京:
他们有联机标引系统
许培扬 北京:
远程标引
医信天下徐立水:
噢
许培扬 北京:
我们所里的标引员也用 的
医信天下徐立水:
现在主题词词组有多少个啊
医信天下徐立水:
英文的么
许培扬 北京:
标引时 系统有用词的提示可以参考
许培扬 北京:
是的
许培扬 北京:
2万多个主题词
医信天下徐立水:
这个计算机很容易做到
医信天下徐立水:
非常容易
许培扬 北京:
是的
许培扬 北京:
可以提高标引的准确性
许培扬 北京:
很好的
医信天下徐立水:
中文也是这样么‘
医信天下徐立水:
人工标识 机器提示吧
许培扬 北京:
是的
医信天下徐立水:
中美是一样的了
许培扬 北京:
中文是计算机抽取关键词 自动转换为主题词
医信天下徐立水:
只有全文和摘要需要
许培扬 北京:
是的
医信天下徐立水:
不用主题词
医信天下徐立水:
用户直接检索 可以么
许培扬 北京:
是的
许培扬 北京:
可以的
许培扬 北京:
关键词检索 检索效率差
许培扬 北京:
查不全 查不准
医信天下徐立水:
是么
医信天下徐立水:
我可能是习惯了主题词思维 所以没有感觉到
许培扬 北京:
是的 一般检索可以 专业检索不行的 比较科技查新检索
许培扬 北京:
是的
许培扬 北京:
比如科技查新检索 需要查全
医信天下徐立水:
查新 应该用全文检索
许培扬 北京:
不能遗漏文献
许培扬 北京:
是的
许培扬 北京:
有主题词检索 就全 准
医信天下徐立水:
主题词会遗漏一些论文
医信天下徐立水:
噢
许培扬 北京:
主题词与关键词结合起来检索更好
医信天下徐立水:
就是进入库的文章一定有主题词
医信天下徐立水:
一般标注几个主题词
许培扬 北京:
10个
医信天下徐立水:
是不是有些多
许培扬 北京:
不多的
许培扬 北京:
太少 容易漏检索
医信天下徐立水:
对标注领域有要求么
医信天下徐立水:
例如 10中 疾病3个 药品3个 治疗2个 诊断2个等等
许培扬 北京:
美国对文献分类的
医信天下徐立水:
他们怎么做
许培扬 北京:
标引文献中的重要内容
许培扬 北京:
分为论著 综述 等类型
医信天下徐立水:
噢
医信天下徐立水:
咱们不么
许培扬 北京:
差不多的做法
医信天下徐立水:
现在论文量大 10个是不是太多了
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 12:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社