武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

不太好理解的数据

已有 3930 次阅读 2016-8-8 14:55 |个人分类:科学计量学研究|系统分类:观点评述

不太好理解的数据

武夷山

 

     《图书情报知识》双月刊2016年第4期发表了一篇题为《中国与“一带一路”沿线国家科技合作现状研究》的文章,文章说:

 

    62个一带一路国家中,只有29个国家与中国拥有合作专利,其中合作专利最多的5个国家是新加坡、印度、以色列、俄罗斯和马来西亚。这个好理解。

29个国家中,与中国合著论文最多的分别是新加坡(24224篇)、蒙古(10520篇)、印度(8545篇)、格鲁吉亚(8533篇)和波兰(5287篇)。这个数据不好理解,尤其是蒙古与中国的合著论文量。

我粗粗浏览了一下蒙古教育文化科学部2007年颁布的“2007-2020科学技术主体规划”(http://unesdoc.unesco.org/images/0015/001514/151490E.pdf)文件,都没有找到蒙古国际论文发表量的数据,该文件只说了自科论文与社科论文的占比(哪位若有空仔细读这个文件,发现了国际论文发表量数据,请告诉我)。也许是国际论文量实在太少,说出来都不好意思。那么,蒙古与中国的合著论文居然有1万多篇?

哪位博主若有过与蒙古科技人员合作的经验,请评估一下这个数据是否能得到合理解释?

 

又及:

感谢李江博主的评论和李杰博主提供的更多信息(http://blog.sciencenet.cn/blog-554179-995256.html)。

蒙古总共才3000多篇论文,与中国合著1万多篇自然不可能。

我猜测(没有依据),由于作者用Mongolia作为检索词,说不定把我国内蒙古的论文给检索进来了;另外,作者若将Georgia的论文都作为格鲁吉亚的论文就糟糕了,因为检出结果中说不定含有美国佐治亚州(也是Georgia)的论文。李杰的检索表明,格鲁吉亚总共才1000多篇论文,怎么会与中国合著8000多篇?

总之,做文献计量研究,数据清洗怎么强调都不过分!




https://blog.sciencenet.cn/blog-1557-995243.html

上一篇:不会升(生)----日记摘抄509
下一篇:美国国家科学院、工程院、医学院网站介绍的12个女科学家博客
收藏 IP: 106.120.61.*| 热度|

9 许培扬 刘立 钟炳 史晓雷 蔡小宁 史永文 黄河宁 chenhuansheng xqhuang

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-18 02:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部