||
小议数据库和数据源的完整性
黄安年文,黄安年的博客/2019年6月01日发布(第21725篇)
在社会信息化时代,建立有完全知识产权的各类信息库是极其重要的。我们通常所说的大数据,真实全面是两个最基本的要求。首先是真实可靠,如果大数据建立在不真实可靠的基础上,运用这样的大数据来支持立论就会出现偏差,这是显而易见的道理;再则是尽可能的全面,就是不要漏掉重要的信息源。例如科学网迄今最新原创博文编号是1182374篇,最新转载博文编号是1182328篇,就是说原创加转发的博文自2007年以来有118.23万多篇,如果科学网有较为精准的博文分类统计数据加入大数据库,其学术贡献和社会共享信息是不言而喻的,遗憾的是迄今我们难以在第一时间检索到发表在科学网上的博文和目录。
笔者的尝试自己动手将自2007年3月以来发表在科学网上自己的博文撰写成每月的博文目录和博文分类目录,如今集结成册(每1000篇博文目录一册)已经有21册了,方便自己检索、也有助于读者查阅。
今天我发布了《笔者2019年5月博文分类目录》(黄安年缉,黄安年的博客/2019年6月01日发布第21724篇),这21724篇占科学网博文总数的1.837%,也算没有功劳有苦劳。我在开头写了如下的话:
2007年3月7日以来总共发文21837篇,图片16万多张,累计访问量为5590万人次。记叙伟大时代生活所见所感所闻所想每一天,乃历史学者的责任担当。我的博文绝大部分是原创,也是学术性、普及性、知识性、见闻性、即时性博文居多,笔者博文既不涉闲聊话题,也不刻意追求博文数量。
自2018年6月16日起,每篇博文注明编号供查,只是为了核准发布博文的实际数量(博主发布数量和科学网统计的误差有110篇左右,个别博文被科学网“奉命删除”的目录计入。网友欲查阅其中任何一篇博文,可直接点击博文IP地址。2019年5月共发博文(21536-21722)186篇,图片1203张,平均每天发文近6篇,源于完成所藏英文书目最后及个人论著书目的编撰。
笔者受邀开博的宗旨是:学术为公,实事求是,与时俱进,资源共享。作为一个已经退休20年的美国历史和世界历史教学与研究者,笔者撰写博文是为了记叙这个伟大的转折年代,这个全球化的时代,这个加快复兴中华进程的时代,由工业化现代化转向现代化信息化社会巨变的时代,一个国际环境面临大调整尚不确定的变化时代,一个外部形势已经开始发生明显变化的时代,在我的博文里记叙着全球发展和家国情怀的个人视野,也纪录了历来被忽视的沉默的的群体和角落,书写着自己的所见所闻、所感所悟、所思所想、所论所汇、所喜所忧。我撰写博文12年,绝大部分是原创,学术性、普及性、知识性、见闻性、即时性博文居多。坚持天天写博文,有内容写、动脑筋写、健体健脑励志。其中微量博文和微信相连,欲了解全貌,请直接阅读科学网博客。任凭风浪起,学术自主行,坚持写有内容的博文是关键。
今年5月10日正值铁路华工参加建设美国太平洋铁路150周年,,有48篇博文专涉沉默道钉话题。本月博文的重头戏依然是集辑个人藏书书目,主要是黄安年文存书稿讲稿和纸媒著作中收录的个人文章内容。
博文目录的编撰实为便于自己和读者检索,有利于数据库资源共享,希望读者点击IP地址能够无障碍查阅。
黄安年博文目录(00001--21000)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 00:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社