许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

医学信息利用的新发展

已有 18296 次阅读 2010-12-2 10:43 |个人分类:信息检索|系统分类:论文交流| 医学信息, 医学信息利用, 新发展

医学信息利用的新发展

在近代出版业兴盛以前,学术信息交流是一种“礼物交换机制”。20世纪后半期,随着各国的高等教育蓬勃发展,学术信息交流范围的扩大,学术信息产生的数量和对学术信息的需求大大增加,形成了以市场为基础的学术信息交流机制,研究者、出版发行机构、文摘索引编辑机构、信息提供商、图书馆和读者共同构成学术信息传播的循环体,奠定了以文献作为载体的信息交流在科学信息交流体系中的主导地位。
20世纪90年代以来,信息技术和网络技术的发展与成熟,促进了e-Science、e-Research、e-Learning等新型数字化科研环境和教学环境的出现和快速发展,使得学术环境发生变革,科研人员的学术交流过程和手段不断更新,学术交流体系发生重构。在此过程中,数字出版、开放获取、虚拟社区等以网络为载体的新型学术交流模式日益涌现,并因此打破了传统以文献为主要载体的学术交流模式受地点、空间和时间限制的局面,提高科学信息交流效率和缩短知识创新周期,而逐步成为学术交流体系的新主体。
网络技术的兴起和数字化浪潮的涌起,使得各种类型的数字媒体正日益渗透到出版业,改变着人们的阅读习惯,影响着出版方式的改变,促使出版业向数字时代转移,验证了英国著名情报学家Lancaster约30年前关于数字出版的预言:“在我看来,在科学及其他领域出现完全无纸化的出版体系并不是问题,而在什么时间出现才是唯一真正的问题。”很多专家、学者和企业家都认为“数字出版是大势所趋”,中国出版科学研究所发布的《中国数字出版产业年度报告》预测到2010年,新出版的图书中50%将是通过电脑、手机、手持阅读器进行阅读的电子图书。
1. 数字出版的概念 2000年前后,在出版业比较流行的概念是“电子出版”和“桌面出版”等,随着互联技术和通信技术的发展,“网络出版”、“在线出版”、“无线出版”、“跨媒体出版”、“手机出版”、“数字出版”等概念才相继出现。“数字出版”这一概念虽然出现相对较晚,但较多学者认为数字出版是最为通用的概念,涵盖性最强。
图10-1-1 出版社对数字出版相关概念的认同比较
数字出版是指用数字化的技术从事的出版活动。数字化技术的本质是二进制技术(0,1),最小单位是比特(bit)。因此,从广义上讲,只要是用二进制技术对出版的任何环节进行的操作,都属于数字出版的范畴,包括原创作品的数字化、编辑加工的数字化、印刷复制的数字化、发行销售的数字化和阅读消费的数字化和日常应用数字化等。因此,数字出版强调的不只是介质,还包括出版流程。
与传统出版业相比,数字出版产品的生命周期延长、制作成本低、多样化显著,使资源整合与再利用空间扩大数字出版的按需出版模式降低了经营风险,可充分挖掘短线图书、学术出版物的内在价值、学术价值和文化积累价值加快了产品出版进度。从用户的角度来讲,能够实现全文检索与智能检索,满足多样化的消费形式、消费人群提供更完善的服务方式与渠道、更丰富的选择空间,用户需求得到最大化满足。
2. 数字出版的特点  仅就数字技术来看,数字出版具有以下主要特点:(1)产品的数字化:产品具有较强的技术依赖性,信息易压缩、加密以及多种媒体形式的嵌入、整合;(2)流通网络化:通过互联网以数字信息形式进行传输,面对最终用户,以直接阅读或下载等形式完成流通过程;(3)服务数字化:存储方式、流通方式、支付方式实现数字化,有利于开拓崭新的信息服务商业模式可实现多层面的信息交流与挖掘、分析,实现了作者、读者、编辑多方面的信息分享、沟通,为向读者和作者提供更深层次的延伸服务提供数据基础通过数据挖掘与分析、汇总。
按照不同的分类标准,数字出版物可以归入不同的类别。按载体类型来分,数字出版物可分为软磁盘、只读光盘、交互式光盘、照片光盘、高密度只读光盘、集成电路卡和互联网出版物等。按照媒体信息类型来分,数字出版物可以分为文本型、图像型、音频型、视频型和多媒体型,等等。
在实际生活中应用和发布布较为广泛的数字出版和数字出版物形式主要包括数据库、电子图书、数字期刊、数字报纸、按需印刷、数字音像出版物和软件读物。数据库是发展历史最悠久的数字信息资源,作为技术和作为出版形式的结合,其影响已渗透于其他各种形态的数字出版中。如目前国际上大多数主要的学术期刊出版商和学术机构都通过数据库方式提供全文数字化期刊的集成服务。电子图书是以数字形式将图书内容存储于硬盘、光盘等计算机存储介质上的出版物。电子期刊,从广义上讲,除了包括通过互联传播和发行的杂志,还包括通过互联传播和发行的快讯、通讯、电子论坛等。数字报纸则是指报纸的新闻稿件和图片资料以数字形式存储并提供读者使用。按需印刷(Print-on-demand),简单来讲,就是按照用户对出版物的数量和生产周期的要求,用联网的数字印刷设备来完成印刷工艺和印刷任务,源于美国,按需报纸(Newspaper-on-demand)则是按需印刷技术在报刊发行领域的主要应用。数字音像出版物具有以数字化形式存储于光、磁介质上,借助于计算机及类似设备读取的特征。软件出版物通常是数据和程序的结合,教学应用软件、游戏软件是软件出版的典型。
图10-1-2是美国PressPoint公司核心软件产品“PrintPoint按需报纸系统”主页(http://www.pressdisplay.com/pressdisplay/zh/viewer.aspx )
图10-1-2 PressPoint公司 PrintPoint按需报纸系统主页
有学者根据近年来国内外产业与相关行业的发展态势,对数字出版发展做如下方向性预测:①载体形态迅速从光盘向网络、半导体等存储介质、无线网络发展;②网络环境向具有自主知识产权的第二代IPv6平台发展;③内容信息运营从用户被动接受向定制主动跟踪推送服务;④内容信息传播方式从有线向无线发展;⑤阅读方式从在线阅读向离线阅读发展;⑥阅读内容从文字阅读向视觉阅读发展;⑦数据组织方式从线性结构向非线性拓扑结构发展;⑧内容信息检索技术从字符匹配向基于内容对象的关系型结构发展;⑨内容信息的媒体表达从单一媒体向复合媒体及交互过程多样化发展;⑩数字版权保护从载体加密向内容加密和版权管理发展。
随着信息、网络等技术的高速发展,各种媒体的界限逐渐模糊,相互融合的速度加快,以高科技为主要手段和特征的现代内容产业的迅速产生和壮大,已经成为不可逆转的社会发展趋势。可以预测数字出版的版权、安全性、价值链集成如支付等问题将随着技术的进步得到逐步解决,发展成为主旋律。数字出版带来的技术创新、产业进步将打破了原有出版产业的发展制衡格局,产业链的上游、中盘、下游乃至著作权人、传播者、消费者的关系需要重新界定与调整,由此催生了一种新的产业链模式,旧的产业链的各环节的角色也会发生相应变化。
开放获取(Open Access,OA)是国际学术界、出版界、图书情报界为了打破商业出版者对科学研究信息的垄断和暴利经营,推动科研成果的交流与传播而共同采取的行动。其目的是促进科学及人文信息的广泛交流,促进利用互联网进行科学交流与出版,提升科学研究的公共利用程度、保障科学信息的长期保存,提高科学研究的效率。
“布达佩斯开放获取倡议”(Budapest Open Access Initiative,BOAI)对开放获取的定义是“通过公共网络可以免费获取所需要的文献,允许任何用户读取、下载、拷贝、分发、打印、检索以及获取在线全文信息,支持爬行器收获并建立本地索引,支持用于法律允许的其它目的(不包括商业、法律、技术贸易壁垒方面的应用) ,唯一的限制是复制与发行”。
作为一种基于互联网的新型学术交流方式和出版模式,开放获取具有明显的网络特征:①在信息的交流与传播方面,打破了传统的时空限制,交流的范围大大扩展;②在信息交流的内容方面,开放获取只是提供学术交流的平台,只有质量上的控制,而对内容与形式没有严格的限制,可以是期刊论文,也可以是专利文献、学位论文等,可以是文本文件,也可以是多媒体文件;③在存取途径方面,强调“开放与自由”,同一文件可以多种途径、多种方法检索与阅读,交流范围覆盖整个互联网,各系统间具有良好的互操作性,以免费或收取少量的费用方式减少获取障碍;④在文献的使用方面,读者对学术文献的使用权利大大扩充,可以为教学、研究、学习等目的而公开复制、打印、利用、扩散、传递和演示;⑤ 在交流方式与效率方面,重视提高信源、信宿交流的直接性和交互性,可以实现作者、读者、编辑之间一对一、一对多、多对多的交互模式,重视提高学术交流的时效性,增进文献处理自动化程度,缩短出版周期。
(二)OA期刊(Open Access Journals
开放获取服务的实现途径有很多,如个人站点、搜索引擎、邮件列表服务、主题论坛、学术Blog、维基、RSS订阅等,但目前正日益被学术界认同,并得以广泛应用的两种主要途径是开放获取期刊和开放获取仓储,且后者主要表现为机构知识库。
1. OA期刊的概念与特点 学术期刊是科研成果主要表现形式——科研论文的主要载体,是学术交流体系的主要媒介。OA期刊作为一种在线免费取阅、付费发表、经同行评议的学术期刊,它的出现是对传统学术期刊的挑战。与传统学术期刊相比,其主要特点不在于期刊的载体是纸本还是电子,而在于对期刊的访问方式和访问权限。传统学术期刊市场的出版控制权主要掌握在商业出版者手里,无论是印本期刊还是电子期刊,都采用的是用户付费的商业模式,或是先由图书馆等机构团体购买,然后为其成员提供检索全文服务;或是由用户个人直接订购整刊或某篇特定文章。而OA期刊提倡的是用户利用Internet就可以不受限制的访问期刊论文全文。为提供基本运行费用(尤其是开展同行评审工作),OA倡导者提出了多种成本弥补途径,包括争取相关机构的赞助、广告收入和为用户提供增值服务收入等,但最主要的是作者付费模式,即作者从项目或课题中抽取部分经费用于出版研究成果,因为作者付费模式具有合理性并可以保证开放获取出版的可持续发展。
2.OA期刊的类型 目前,开放获取期刊分为三大类:延时开放获取期刊、半开放获取期刊和完全开放获取期刊。延时开放获取期刊指出版一段时间(如几个月或者一年)以后,可以免费获取的期刊。现在已经有许多期刊出版者提供这种延时免费获取服务,根据全球非赢利出版商同业协会2003年的调查,9%的出版者(主要是一些小型非赢利性出版者)会将他们的期刊在出版数月或者一年左右后免费提供。半开放获取期刊指部分内容提供开放获取形式的期刊。主要是对两类内容进行开放获取:第一,是特别重要或者有报道价值的文章,这类内容开放获取的目的是吸引更多的读者;第二,是作者支付出版费用的文章。完全开放获取期刊指完全采用作者付费而不采用读者付费商业模式的期刊。
3.生物医学OA期刊现状 就主题学科领域来看,目前OA期刊主要以科学、技术与医学(STM)为主,其中,生物医学OA期刊占有很大比例。据网络版乌利希期刊指南(Ulrichsweb.com)数据统计,3714种OA期刊中,主题为生物(Biology)或医学(Medical Sciences)就有1191种,约占32%。DOAJ(Directory of Open Access Journals)收录的涉及17个学科领域的3815种OA期刊中,生物医学类则有668种(含Biology and Life Sciences的202种及Health Sciences的466种),所占的比率高居第一。BioMed Central、HighWire Press、PLoS、PubMed Central等国际权威开放获取资源网站提供的OA期刊也多侧重在生命科学与医学领域。在研究人员非赢利性信息传播动机和利用需求,以及网络信息技术发展的推动下,OA期刊不断发展壮大的同时,其学术质量和影响力也在不断提高。大多数生物医学开放获取期刊都实施严格的质量控制,基本上都采用同行评议机制作为质量控制手段,许多期刊具有很高的影响因子,如美国的《PLoS Biology》将自己定位为和《Nature》、《Science》一样的顶级综合生物学期刊,最新的影响因子高达14.1。统计表明,OA期刊的整体影响力也处于中等偏上水平,据JCR收录的2007年数据统计,生物医学类OA期刊的平均影响因子为3.85,比非OA期刊的高出1.56(OA期刊的影响因子为2.29)。
图10-1-3 DOAJ(http://www.doaj.org/)
图10-1-4 BMC(http://www.biomedcentral.com/)
(三)OA仓储(Open Access Repository
OA仓储(Open Access Repository)不仅存放学术论文,还存放其它各种学术研究资料,包括实验数据和技术报告等。从目前的发展来看,OA仓储主要有学科OA仓储和机构OA仓储两种类型。
1.学科OA仓储 早期的OA仓储多为学科OA仓储,而且因不同学科研究人员接触网络的时间和使用网络的熟练程度不同,早期的学科OA仓储往往也只限于自然科学领域,社会科学和人文科学领域的OA仓储则是最近几年才开始出现。arXiv电子印本文档库(http://arxiv.org)堪称是学科OA仓储的代表,最初由美国Los Alamos 国家实验室的Paul Ginsparg于1991年创建,现由康乃尔大学进行维护和管理,其涉及学科领域覆盖物理学、数学、非线性科学、计算机科学和量化生物等五个学科领域。研究者按照一定的格式将论文进行排版后,通过E-mail、FTP等方式、按学科类别上传至相应的库中。arXiv电子印本文档库没有评审程序,不过同行可以对文档库的论文发表评论,与作者进行双向交流。论文作者在将论文提交e-print arXiv的同时,也可以将论文提交学术期刊正式发表,论文一旦在某种期刊上发表,在e-print arXiv中的该论文记录中将会加入文献正式发表期刊的卷期信息。目前arXiv中国镜像(http://cn.arxiv.org/)也已开通运行。
2.机构OA仓储 也称为机构知识库,机构仓储,或机构典藏库。不同学者对其含义的认识与表述还不尽相同,但究其实质均为:机构依托网络运行的一组资源管理与服务机制,它以本机构成员在工作过程中创建的各种知识产品如科学数据、科研文献、科研成果、教案、讲稿等资源,尤其是以数字对象为内容,以对这些对象的捕获、收集、整理、集成、描述、标识、组织、索引为途径,以实现对这些对象的永久保存和广泛传播为目标。一般由大学、大学图书馆、研究机构和政府部门等创建和维护。
相对学科OA仓储而言,机构OA仓储起步较晚,但由于其能够为机构提供完整保存和展示机构生产的知识产品的场所,具有为对各种资源进行数字化发表、传播和长期保存的功能,为科研人员提供了一个新的学术交流和知识共享的平台,提高其学术影响力和地位等方面的优势,已成为国内外科研机构关注的重点项目,发展速度很快。目前已涌现了许多机构知识库相关软件,有专用系统的、开放源代码和免费系统的、商业系统的和混合型系统的。其中放源代码和免费系统应用较为广泛,尤以由美国麻省理工学院和惠普公司共同开发的DSpace系统机构知识库软件、南安普顿大学的EPrint为代表。国外已有数百家机构利用Dspace和Eprints系统建立了各具特色的机构资源库和学科资源库。佛罗里达州立大学的D-Scholarship仓储(http://dscholarship.lib.fsu.edu已成为开放获取和机构知识库的典范。我国学术界自2003年以来,也一直关注与支持机构知识库的发展,并积极开展实践,较为成功的是中科院国家科学图书馆机构知识库(http://ir.las.ac.cn/、厦门大学的学术典藏库XMU(http://dspace.xmu.edu.cn/ dspace/)和香港科技大学的学术仓储SIR(http://repository.ust.hk/dspace)。))
开放获取代表着未来信息交流的发展方向,随着开放获取运动的深入发展,正有更多的机构参与到各种开放获取资源建设中来,并通过开放获取协议实现各种开放获取资源库的有效集成,被各种搜索引擎、特别是学术类搜索引擎收录,成为一种主流的文献信息资源系统和学术信息交流平台。
但作为一种新生事物,开放获取的发展在技术、管理和知识产权等方面面临着众多挑战。在技术方面,亟需解决如何适合海量存储与开放访问的IT基础设施建设;如何建立多级的、全球化的联邦信息组织与服务体系结构;如何构建适合e-science、Open Grid发展需要的信息服务模式;如何突破单一的、静态的信息组织方式,建立复合的、动态的数字对象管理体系,实现知识管理与语义检索服务等问题。在管理方面,亟需解决如何处理作者、出版者、用户和图书馆员等多种角色之间的关系;如何确立传统期刊向开放获取期刊过渡策略与方法;在不收订购费与访问费的情况下,如何解决网络出版的经费问题;如何制定网络出版的质量控制策略,特别是如何建立行之有效的、跨机构的评审联盟制度等问题。在知识产权方面,亟需解决如何解决传统出版模式向网络出版过渡期间知识产权划分的问题;网络出版模式下,知识产权的表现形式是什么,如何指定相应的管理策略,如何保护产权人利益等。
网络最大的特点就是其超越了时间和空间的限制,跨越了地缘和血缘的关系。随着社区技术的快速发展和社区应用的普及成熟,尤其是在Web2.0浪潮推动下,互联网正逐步跨入社区时代,现实生活中不同区域的人通过网络的联结形成了一个经常接触、互相帮助、有情感交流甚至物质交易的“社会”,形成了一种“虚拟存在”,即虚拟社区(Virtual Community),也可称为网络社区、虚拟社群,目前正越来越显著地影响着人们的生活、工作和学习。
传统社会学意义上的社区概念,一般是指聚集在一定地域范围内的社会群体和社会组织根据一套规范和制度结合而成的社会实体,是一个地域性社会生活共同体。”它具有一定的地域、一定数量的公众、相应的组织、公众的参与和某些共同的意识与文化等共同的特质。虚拟社区,不是一种物理空间的组织形态,而是指以现代信息技术为依托,在互联网上形成的,由具有共同兴趣及需要的人们组成,以旨趣认同的形式作在线聚合的虚拟生活共同体。其核心是参与者的交互,包括网络空间、技术、参与者、参与者产生的内容、关系、共同目标等属性。
可从不同角度对虚拟社区进行了分类。从人们追求自身的需求满足来看,虚拟社区可分为:①兴趣型社区,使得具有共同兴趣爱好的人聚集在一起分享兴趣;②关系型社区,为具有共同经历和观点的人提供聚集在一起分享经历并建立新的个人社会关系的机会;③娱乐型社区,为人们提供了梦想以及娱乐的空间;④事务型社区,使得参与者能够通过网络进行信息的交易。从虚拟社区成员互动内容的角度,可将虚拟社区分为三类: ①以知识共享为主要活动特征的虚拟社区。虚拟社区成员间主要以知识流进行联结。例如,微软中国专业社区是以信息技术的知识共享为主要活动特点,网易、天涯等大型综合性社区中的经济、管理、IT 子社区也以知识共享为主要活动特征。②以商务信息交换为主要活动特征的虚拟社区。例如阿里巴巴、易趣、淘宝,等等。③以情感交流为主要活动特征的虚拟社区。虚拟社区成员间的主要以情感流进行联结。如交友社区、城市社区等。其它分类角度还包括,人们参加虚拟社区的动机、虚拟社区采用信息技术、虚拟社区组织类型,等等。
图10-1-5 微软IT专业人员社区
与真实社区相比,虚拟社区是一种新的建立在信息技术基础上的社会组织形式,具有非地域性、虚拟性、空间性和自组织性等特点。①非地域性。这是虚拟社区最重要的特征。虚拟社区中人际互动是通过网络实现的,改变了人们面对面的互动方式,打破了现实社区的地缘要求,扩大了互动范围,延伸和拓展了人的社会化空间。②虚拟性。网络技术将物理的人替换为虚拟的人,将现实中的人与人的关系替换为数字化关系时,人以及人与人之间的关系都借助于“比特”,以数字化的方式呈现出来。③空间性。虚拟社区的空间不是地理上的空间,而是借助于信息技术建立的数字化空间。在互联网上,不同地域的人们根据各自不同的兴趣、爱好、目的、需要,汇集于不同的电子空间内,从而形成一个个不同的生活共同体。④自组织性。虚拟社区中不存在行政机构,所有交往是基于相同或相近的兴趣、爱好,以及互补的利益需求,社区居民不再是信息的被动接收者和社区设施的使用者,而是信息的主动提供者和社区设施建设的参与者。
知识是一种稀缺资源,属于知识主体的无形资产,但这种资产不具有损耗性,即当一个人将知识提供给另一个人时,提供者不会因此而使自身知识减少。知识共享是指不同的知识主体自愿相互传递和分享知识的过程。
虚拟社区知识包括显性知识和隐性知识,前者包含社区文档、讨论记录、概念模型和定义的工作流等,后者来源于社区成员的大脑。虚拟社区的知识共享包括两层含义,第一层含义是指虚拟社区的个体成员之间互相传递和交流知识,比如一些成员提出问题,另外的成员给出解决问题的知识,或者是个体成员在社区发帖子主动介绍自己的经验和技能知识;第二层含义是指虚拟社区作为知识主体提供知识给成员,成员奉献知识给社区,社区与成员之间互相分享知识,具体表现为社区收集整理成员交流过程中留下的知识记录,成员向社区查询某一主题的有关知识。
虚拟社区知识共享行为主要发生在社区成员之间,包含知识外化和知识内化两个过程。知识外化是指将隐性知识显性化,知识提供者通过将个人所拥有的知识编撰、整理,用语言、文字、图示等符号表达和传递给接受者,或者是将个人所拥有而别人没有的显性知识传递接受者。知识内化是指知识接受者对显性知识进行学习并将之转化为个人知识系统的一部分。成员之间的知识交流过程可能是单向的,一方传递知识,另一方接受知识,也可能是双向的,成员在互动过程中担任双重角色,既是知识提供者又是知识接收者。在成员之间的互动过程中,虚拟社区充当交流媒介作用。图10-1-6是虚拟社区知识共享过程示意图。
图10-1-6 虚拟社区知识共享过程
实际上,虚拟社区这一概念从涌入人们视野开始,便引起了理论界和实务届的重视,有了蓬勃发展。虚拟社区的发展及其研究可以划分为5个阶段。第一阶段是基础理解阶段,主要是理解虚拟社区的概念、定义、规则等,需要回答的问题是虚拟社区究竟是什么;第二个阶段是技术解决阶段,主要需要解决的问题是如何建立虚拟社区,使用何种技术保证虚拟社区中的信息交流等关键技术问题;第三个阶段是应用阶段,在这一阶段中主要研究虚拟社区能带来哪些应用,包括虚拟社区对知识共享、新的社会关系的建立等各方面的作用;第四个阶段是评估阶段,主要是在虚拟社区发展过程中获取经验,并评估结果;第五个阶段是产业化阶段,在这一阶段中主要的关注点在于如何使虚拟社区得到商业化的应用,使虚拟社区在经济上获得成功,使之成为一种产业,最为典型的应用即是电子商务的应用。在实际中,这五个阶段并非是按顺序依次发展的,是平行发展的。
信息共享中心(Information Commons,简称IC),国内也有学者译为“信息共用”、“信息共享空间”,其理念源于管理学的战略合作理论,兴起于20世纪90年代后期北美,随后在许多研究图书馆得以成功实践。
(一)IC的概念
目前关于IC还没有一个统一的概念。Donald Beagle强调了IC作为技术和服务的整合空间的特性,认为“IC是一种性的基础设施,是围绕综合的数字环境而特别设计的组织和服务空间。作为一个概念上的教育空间实体,IC涉及从印刷型到数字型信息环境组织的重新调整,以及技术和服务功能的整合”。美国图书馆协会前主席Nancy Kranich认为“IC确保对理想信念的开放获取和利用,它以价值、法律、组织、通讯设施和资源等内容为特征,促进信息共享、共有和自由存取,鼓励人们在民主讨论中学习、思考和实践,是民主活动的基础”,强调了IC自由获取和开放获取的特点。Nacy Allmang等人从IC构成要素角度对IC进行了描述,认为“IC由物理空间和虚拟空间共同构成。其中,物理空间是IC的实体,包括个人工作站和小组工作站、会议室、无线网络、写作实验室和休闲室另外还配有图像扫描仪、彩色打印机等硬件设施以及各类程序与文字处理软件”。我国学者孙谨将IC定义为“是虚拟空间和物理空间共同构成的、拥有最新技术设备、提供一站式专业信息服务、培养用户信息能力和计算机能力、注重协作、供用户共享信息资源、原创作品以及学术交流的崭新的平台和空间”,等等。
尽管不同学者对IC的定义或侧重点均有所不同,但总的来说,可以将IC理解为是为适应新技术形式的需要,改被动服务为主动服务,满足用户多种形式和内容的信息需要的动态交流服务模式,是一个集资源、服务、技术及空间的整合体,其核心理念是“空间公用、资源共用”、“用户交流互动”、“维护信息共有”等,目标是通过为不同用户提供学习与交流提供空间和一站式信息服务,促进信息素养和推动研究与学习。
(二)IC构成要素分析
IC的本质是在同一个平台上获取信息资源、获得信息帮助、提高信息素养,并顺利进行学术研究交流的信息服务模式。它不仅是一个物理空间,更重要的是能够提供别处难以获得的资源和服务。因此,IC 的构建离不开空间、资源和服务三个要素。图10-1-7是信息共享空间的概念模型。
图10-1-7 信息共享空间概念模型
空间要素,在布局设计上,一般包括信息服务台,用于参考咨询和技术支持的问答服务区域;个人学习空间,为个人提供进行个人知识管理所需要的空间和软硬件资源;团体协作空间,主要是供研究课题组和学习小组在此讨论;团队协同工作或培训、会议空间;和休闲区域,供用户休闲使用备有饮料和食品。
资源要素主要包括信息资源、计算机网络设备资源以及人力资源三个方面,其中信息资源主要指图书馆的各种印刷资源、电子资源和网络信息资源。
服务要素方面,既包括基于图书馆信息资源的服务,如阅览流通服务、信息检索服务、参考咨询服务和信息素养教育等;各种基于信息技术软硬件资源服务,如提供必要的网络接入和服务设施,软件使用辅导;也包括通过多方的合作开展写作辅导、专业教育等其他各类型信息服务。
(三)IC服务发展现状
Donald Beagle等人在1999年共同提出在大学图书馆环境中的IC的主要理论和应用指导,认为IC需要提供以下五个方面的服务:①由于数字资源的数量在不断增长,为需要获取各种形式信息资源的用户提供向导和技术支持;②提供合适的硬件和软件处理所获取的信息,并为这些软硬件提供支持;③提供适当的物理空间支持用户进行学术研究和创作;④明确指定这个机构的职责、图书馆的管理人员以及创作、支持和维护这些组织和服务的工作人员;⑤提供一个鼓励、指导以及支持不断改进的文化环境和机制,这是学术图书馆不可或缺的。
发展至今,虽然各图书馆的IC的模式也不尽相同,随着实践的发展,其功能不断得以完善。现行较为成熟的IC能够通过在同一个平台上整合多种资源与服务,为用户带来了一种全新的服务体验,能够为用户提供一站式集成服务,方便用户足不出户就能够便捷地享受到图书馆员、计算机专家、学科专家的联合咨询服务,完成自己的学习和工作任务;能够充分照顾到用户的个性化需求,强调团体的讨论与学习,为用户提供了一个相互合作进行学习研究和交流的良好空间;能够直接面向用户需要解决的问题和任务本身,并通过IC 将所有的图书馆工作直接面向用户,真正体现了以用户为中心的服务理念和业务模式。
E- learning作为适应信息社会特点的新的学习方式,能够有效提高学习效率,促进协作学习、知识构建和知识创新,发展组织集体智慧和增强组织竞争力,正日益受到人们的重视。OCLC 于2003 年发布的《环境审视》报告确定了几种最重要的趋势或技术,E-learning就位列其中。
“E- learning”这个词是由“E- Commerce”( 电子商务) 迁移产生,目前在国内主要有三种译法,即网络化学习、数字化学习和电子化学习。
美国教育部2000年“教育技术白皮书”中关于“E-Learning”概念有4种阐述:①E-Learning是一种受教育的方式,包括新的沟通机制和人与人之间的交互作用。这些新的沟通机制包括计算机网络、多媒体、专业网站、信息搜索、电子图书馆、远程学习与网上课堂等。②E-Learning指的是通过因特网进行的教育及相关服务。③E-Learning提供了学习的随时随地性,从而为终身学习提供了可能,学生在E-Learning中是以一种全新的方式进行学习。④E-Learning将改变教师的作用和师生之间的关系。
我国知名教育技术专家何克抗教授对E-Learning的阐述是“通过因特网或其它数字化内容进行学习与教学的活动,它充分利用现代信息技术所提供的、具有全新沟通机制与丰富资源的学习环境,实现一种全新的学习方式”。
与传统的学习模式相比,E-Learning具有下列显著特点:
①开放性:E-Learning的最大优势在于:学习不受时间、地域和年龄限制,可是实现任何人、在任何时间、任何地点学习任何内容,让学习成为新世纪最具开方性的社会活动。
②个性化:在E-Learning条件下,基于网络的资源学习系统可以提供资源管理工具,为教育者组织、编辑、管理资源提供帮助,为学习者利用资源进行学习提供方便。教育者无需以相对固定的形式进行教学,可以根据教学需要,随时增减资源;可以根据不同的教学内容和学习者特征,组织灵活的教学策略。学习者既可以在线学习,也可以通过下载资源实现灵活的离线学习。
③协作交互性:学习者在学习过程中,通过学习伙伴交流获得的知识占学习者知识总量相当大的比重,特别在涉及到较高级的认知能力的学习场合,学习伙伴间的协作更加重要。研究表明,基于在线方式的学习能够让学生更加深入地进行讨论和介入。在E-Learning环境中,学习者与学习者之间,学习者和教师之间,可以在任何时间通过电子邮件、聊天室、在线问答等方式进行双向的和多对一的交流。
④资源丰富多样:E-Learning不仅仅单纯强调课件的重要性,以教学内容为中心编制课件,它视各种材料均为学习资源,各种形式的数字资源均可以为教学和学习提供服务。
⑤虚拟教学:网络环境下E-Learning的一个重要特点就是,没有固定的校园和课堂,而是利用计算机技术、通信技术、仿真技术、人工智能技术等进行双向交互式教学。
⑥成本低廉:E-Learning不仅可以扩大受众的数量,消除了把培训者和学习者、教师和学生聚集在一起不便,而且能够免去或大幅度减低对课堂、教师及基础设施的需求等所导致的费用。据统计,采用E-Learning模式较传统模式可节约15%-50%的费用。
⑦高效性与前沿性:E-Learning学习资源更新速度快,能够及时广泛地提供领域内的各种相关政策,前沿动态等,能够让学习者快速获悉最新的信息,并且作出快速的反馈。
E-Learning具备了传统学习模式多不具备的特征,这些特征为不同的机构提供了利益,从学习的效率、投入和效果上都产生了巨大的变革,目前,已被全球企业、教育机构和政府机构等认可,得以发展迅速和广泛应用。
1.在企业中的应用 美国培训与发展协会(ASTD) 2007年对221个组织机构的E-learning调查报告显示,采用E-learning培训的时间比例由五年前的11.4%上升至2006年的30.28% ,其中2006年完全在线学习的时间高达25.2%;2007年完全在线学习的时间比例则已上升至30%。ASTD还预测,到2010年雇员人数超过500人的公司中90%都将采用E-learning进行培训。在亚洲,日本、韩国、新加坡等国著名企业已经领先采用E-learning方式进行企业内部培训在中国,教育部高等教育司已启动“数字化学习港与终身学习社会的建设与示范”教学改革项目,旨在努力探索“数字化学习型企业”的建设及运行规律。2008年6月,国内领先的教育技术与教育服务提供商安博教育集团和全球最大的在线教育内容提供商SkillSoft正式宣布携手合作,这一强强联手势必将掀起E-learning在国内发展的新浪潮。
2.在教育机构中的应用 继2000年E-Learning概念提出后,教育信息化进程更是如火如荼进行。信息—课程信息管理、资源整合—教学互动、文献保障—教学参考文献资源保障,成为E-Learning在高校应用研究的三个核心功能。美国麻省理工学院(MIT)于2001启动率先了“开放课件”项目,欲将其所有课程的教学资料通过网络让全世界的教师、学生和自学者免费获取,以促进知识的自由流通与传播。目前,MIT已几乎将该校开设的所有可见都纳入了开放课件范畴。图10-1-8是由中国开放式教育资源共享协会与MIT合作开发的MIT开放式课件中国镜像(http://ocw.zju.edu.cn/OcwWeb/index.jsp。随后,John Hopkins大学、Foothill学院、Carnegie Mellon大学、等高校和相关机构也相继启动了开放课件项目。国内,虽然与国外相比还存在一定的差距,但也正在迎头赶上。2003年,教育部启动了全国高等学校精品课程建设项目,促进了高等院校学习对象组织与建设工作;中国开放式教育资源共享协会(http://www.core.org.cn/以推动全球高校、教育机构的紧密合作与资源共享为使命,致力于为中国高校获取免费、便捷的全球开放式教育资源拓宽渠道;中国教育资源网(http://www.cern.net.cn、中国基础教育网(http://www.cbe21.com等教育网站已开通提供各类型学习对象的收集、检索、下载、浏览等服务。 ) ) ))
图10-1-8 MIT开放式课件中国镜像主页
3.在图书馆中的应用 基于E-Learning开展信息服务,可以帮助图书馆克服时空界限,为世界各地的不同层面的学习者终身学习提供数字化资源,扩大图书馆信息服务的范围。目前,E-Learning在图书馆中的应用主要表现在两个方面:一是为图书馆读者开展信息素质教育提供平台;二是为图书馆专业人员的继续教育提供平台支撑。此外,全面参与数字化教育、授课教学管理及技术管理,与教师开展合作,共同设计多媒体教学课件、网站和课程主页,并协作发展图书馆信息网络,创建面向E-Learning的数字图书馆,目前也已成为众多图书馆涉足E-Learning领域开展服务方向之一,包括我国北京大学图书馆、清华大学图书馆等少数图书馆在内。
(四)E-learning主要发展趋势
1.个性化 从E-Learning诞生到现在,一直有两种观点以不同角度在推动E-Learning 发展。一种观点认为技术在E-Learning 中起到主导作用,如P2P、Blog、Wiki、Web服务等,E-Learning 应该交付计算机更多的任务,让技术担当更多以前需要由人完成的工作;另一种观点认为技术在E-Learning中起到辅助作用,E-Learning只是为教育培训者提供新的手段,技术只是工具,是无法代替人的作用的。在不同应用领域中,两种观点下的E-Learning模式都有了很大发展。但从学习的本质上说,一个有效的在线学习行为,并不取决于是“技术主导”还是“技术辅助”的E-Learning 模式,首要的因素是由学习内容和学习者来决定的。因此,面向不同学习内容和学习者需求,能够同时很好支撑“技术主导”和“技术辅助”的个性化学习模式才是E-Learning未来主要发展趋势之一。
2.知识化 E-Learning与知识管理有着共同元素:社区/虚拟社区、协作/合作、信任和知识共享和共享理解,将E-Learning与知识管理技术进行集成,有利与促进虚拟学习社区中隐形知识和显性知识的相互转化,促进知识创新和共享。因此,将E-Learning服务与知识管理服务进行有机结合,为学习者提供知识化学习模式也将是E-Learning发展趋势之一。实际上,目前已有企业和教育机构试图通过知识管理来提高效益和效率。美国国家科学数字图书馆( NSDL) 项目中的GetSmart系统将知识管理技术应用于学习环境中,通过对学习理论和信息检索过程进行分析,整合检索工具和概念地图工具,创造出一个学生可以对他们获取的知识可视化的学习环境,从而为课程学习提供支持。
第二节 图书馆2.0
自从2005年鲍尔•米勒(Paul Miller)提出图书馆2.0这个说法以来,图书馆2.0经历了从概念到现实的发展历程。越来越多Web2.0的典型技术应用到图书馆服务中,在拓展图书馆信息服务功能的同时,也增加了用户使用图书馆信息资源时的深层体验。图书馆2.0促使信息服务理念发生变化,这种转变在深化用户体验的同时,也进一步提升了图书馆在新的网络环境下面对网络同质服务做出积极响应的能力。
图书馆2.0是一种以用户为中心,强调用户参与和协作的服务理念,核心在于以用户为中心、重视用户的参与、倡导个性化人性化的知识服务、保持开放性的理念,由图书馆提供没有障碍的信息获取途径,并以用户、资源、管理、服务为要素构建图书馆2.0的理论架构。图书馆2.0必然成为未来若干年广受欢迎的图书馆理念模式,也会不断提升图书馆的信息服务水平,图书馆2.0理念指导下的各种应用模式也将成为读者用户获取信息资源的重要途径。
一、图书馆2.0的基础理论
(一)Web2.0的特性分析
1.Web2.0的定义
自2004年O’Reilly公司和国际知名Media Live举办头脑风暴会议,将Web2.0作为概念提出,Web2.0这个崭新的理念在互联网上迅速升温,短短几年内改变了互联网的传统传播模式,它使互联网更加成熟,具有更强的用户参与性、开放性以及网络效应。以Web2.0理念建立起来的Web2.0信息服务,在商业化过程中不断获得巨大成果,这也反过来刺激人们关注和更多地使用Web2.0工具。它使信息提供者和信息消费者之间的界限逐渐淡化,网络用户在网络信息的生成、共享和传播方面占有越来越重要的位置。
互联网实验室给出Web2.0的全面定义是:不单纯是技术解决方案,也是一套可执行的理念体系,实践着网络社会化和个性化的理想,使个人成为真正意义上的主体,从而实现互联网生产方式的变革,这个理念体系在不断发展完善的过程中会越来越清晰。实践Web2.0的成型的应用元素包括:博客、RSS、开放式API’s(开放式应用程序接口)、Wiki、Tag、Bookmarks、SNS、AJAX等;这些应用模式的底层是XML和接口协议,这些应用都是在一些Web2.0体系下的理论和思想指导下形成的。
因此,Web1.0 是将用户牵引到信息面前,而Web2.0 则是直接将信息推送到用户手里,Web2.0 更注重用户的交互行为,用户既是网站内容的消费者(浏览者),也是网站内容的制造者。Web1.0 到Web2.0 的转变,从模式上而言是单纯的“读”向“写”、“共同建设”发展。
2. Web2.0环境下的信息特征
(1)交互性强: Web2.0 环境下的最大特点是交互性强。Web2.0 强调用户的参与,任何使用者在Web2.0 环境下都享有自主组织信息、整理信息的权利,可以根据自己的喜好设置阅览的内容、设置首页的页面风格,例如Blog ,任何一个拥有博客的用户都可以根据自己的喜好设置自己的主页内容,还可以和其他人进行在线交流,对别人的作品发表评论等等。
(2)共享性强: Web2.0 的网络环境为所有冲浪者提供了广泛共享各种资源的便利。
(3)个性化突出:正是由于信息交互性强,共享广泛,所以Web2.0 环境下的信息资源具有个性化突出的特点。每个接受服务的用户成为网站的构建者和参与者,因此,构建出来的网站必然是个性突出,各具特色。
(4)信息反馈及时:用户在Web2.0 环境下可以方便地对他人整理的信息内容发表意见,因此用户之间的交互性强也加速了信息的及时反馈。
(5)信息源具有草根性:在Web2.0 的信息系统中,大量的用户为网络提供信息内容,用户成为信息的生产者,即信源。传统的信源一般是正式的公共机构或公司,它们规模巨大,资金雄厚,比如电台、电视、新闻报纸出版机构、门户网站等。Web2.0 的应用降低了向社会提供信息的门槛,打破了集中式的信息发布和传播方式,信源开始具有了草根性,这种变化也不可避免地导致信息内容的良莠不齐。
(6)信息分布更加分散:Web2.0 环境下信息资源庞杂,信息分布更加的分散,这对信息组织提出了更大挑战。如何更好地组织信息,让用户能方便地使用W eb2.0 网络环境下的信息资源,也是对各Web2.0 站点开发人员的挑战。
(二)Web2.0对图书馆服务的挑战
Web2.0的出现,为个人提供了建立个人信息结构与外部信息的链接工具,也引发了整个社会上信息交流领域的革命,更多的网络用户希望自己有更多的权利来控制自己的数据,并让自己成为知识交流的中心;同时信息发布难度的极大降低,任何人都可以书写内容,拓展了信息交流的广度。这些便对对传统图书馆的信息交流环境产生了巨大的影响,极大冲击着传统图书馆的理念。
1.传统图书馆的服务理念受到冲击
传统图书馆的服务理念是以一种“图书馆中心论”,虽然秉承着“用户为中心”的思想,但是大部分的服务是建立在信息资源管理基础之上,用户很难进入到文献加工、标引工作中去。
2.传统图书馆对社会的影响依赖于社会团体的互动
图书馆以其丰富的馆藏和文化集散地而著称,容易集结社会上大量的正式组织和社会团体,业务活动开展比较容易。但随着Web2.0的到来,大量以个人知识管理为特征的公开站点逐渐增多,其交流的信息内容和广度、深度不亚于图书馆的某系服务,进而影响了图书馆影响力的拓展。
3.Web2.0重视信息使用者的交流
形成信息汇集中心,可以提供互动解题和资源自给的功能,吸引着越来越多的信息用户参与到Web2.0环境下的信息中心,这对图书馆的知识资源聚集的核心地位构成了极大挑战。
图书馆的地位变得岌岌可危,正是这样的网络环境下,图书馆引进Web2.0的思想理念,将Web2.0的思想纳入到图书馆服务体系中,将Web2.0的应用模式、信息互动的方式纳入到图书馆的服务系统、图书馆的各个服务平台中,也能实现信息发布与互动。
图书馆2.0缘起Web2.0出现一年之后,2005年由Michael Casey在其Flickr账户中提到:下一代图书馆服务——Michael Casey对图书馆2.0的看法。其后更多的人开始着手研究图书馆2.0,更多的图书馆学者关注并思考着“基于web 的”、“用户创建内容的”时代中图书馆的生存之道,从而图书馆2.0 的精神与理念日趋成熟。
Meredith Farkas认为图书馆2.0 的概念指的是:(1) 它是一种无缝的用户体验———图书馆系统的可用性、互通性及可塑性是很重要的关键。(2) 它是更多地呈现于社区的图书馆——通过设计程序、建立社群,通过即时通讯、博客、维基等技术实现超越。(3) 它允许读者的参与——通过写书评、在馆藏目录中加上标签(tag) ,或者是通过博客与维基,使读者的声音得以被听见。(4) 它使图书馆更加透明——通过图书馆网页的表现及图书馆实体的设计。
Michael C.在考察了业界对图书馆2.0的看法后,做出了这样的定义:图书馆2.0是由于Web2.0而直接或间接导致的、顺应用户需求而产生的一类图书馆服务。有人认为:图书馆2.0就是利用Web2.0技术改变图书馆的一种服务方式。图书馆2.0的概念至今没有统一的定义,但无可否认的是:图书馆2.0可以看做是Web2.0在图书馆的应用与延伸,图书馆2.0的概念体系是借用了Web2.0的思想和概念,并将其应用到图书馆环境中。图书馆2.0 的概念给我们描绘了一种新的理念,需要我们对图书馆服务的传统模式进行新的定位和转移。图书馆2.0的模式使图书馆用户在图书馆服务及利用服务的方式上能够更好地与人分享,在以提供资源为主的基础上,将更多用户创造的资源纳入到图书馆资源体系中去,并能创新传统的知识组织体系,增强了用户使用图书馆资源时的互动性。因此,图书馆2.0在吸纳读者的智慧改进图书馆的资源建设的同时,也有利于提升图书馆的服务质量。
二、图书馆2.0的应用模式
图书馆2.0带来了信息服务概念的变化,这些转变由此带来的变化需要我们利用或开发一些新的技术手段。图书馆2.0的技术手段与Web2.0的技术手段有相通之处,可以用于图书馆应用服务模式的技术手段主要有如下类型:
RSS (Really Simple Syndication),即简易信息聚合,是RDF 站点摘要(RDF Site Summary)、真正简单的网站联合(Really Simple Syndication)、丰富站点摘要(Rich Site Summary) 等的简称。利用RSS 技术,用户可以在较短的时间内从不同网站上获取自己需要的信息,从而省去频繁登录不同网站查找信息的时间。利用这种技术,网站可以将相关的信息直接推送给用户,用户则通过RSS 订阅器订阅RSS 服务并阅读最新信息内容。RSS阅读器采用RSS 摘要技术,实现了信息的定制,可以满足一般用户的信息聚合需求。目前常用的RSS 阅读器分两种:离线阅读器和在线阅读器,离线的如“周博通资讯阅读器”,在线的如“抓虾”(www.zhuaxia.com)
博客(BLOG),即个人网络日记。它是一种新型的互联网信息传播工具,注重个人思想的表达和用户之间的交流,强调用户的参与性,为用户的个性化行为和页面展示提供运行空间。广大的用户可以以注册或匿名的形式发表评论和留言,进行各种主题的信息交流,加速了信息的广泛共享与交流。
Wiki百科全书。一种可在网络上开放多人协同创作的平台,只要通过网页浏览器及使用很简单的标记语言便可合作撰写文件,它是利用集体智慧的典范, 网络上最有名的应用就是维基百科(Wikipedia) 。图书馆界影响最大的维基应用是2005 年由OCLC 正式开放的维基版联合目录 OpenWorldCat,允许广大的用户来贡献及分享tables of contents、notes 及reviews
社会化网络服务(Social Networking Services,简称SNS)是Web2.0 体系下的一个技术应用架构。它的理论依据是哈佛大学心理学教授Stanley Milgram 于1967 年创立的六度分隔(six degrees of separation)理论,旨在帮助用户提供创建人际关系的社会性网络服务。在Web2.0 时代,每个用户都拥有自己的Blog、自己维护的Wiki,通过Tag、RSS 或MI(即时通讯)、邮件等方式连接到一起,每个个体的社交圈都不断放大,最后成为一个大型的社会化网络。
SNS是现实生活中的人际关系在网络上的一个延伸,将用户人际关系网的资源完全挖掘出来,轻松认识“朋友的朋友”,通过认识的人找到需要的人,积累用户人脉资源,为个体的发展提供更大的空间。
标签(Tag)是一种由用户决定的、更为自由灵活的分类方式。相对图书馆严格规范的分类方法,这种新技术更为开放和自由,用户可以根据自己的理解和爱好,为Blog文章、上传的图片、收藏的网页、订阅的RSS 信源添加一个或多个Tag并且自行对内容进行组织。通过Tag的自行发布,可以增加网络资源的易检性。目前Web2.0技术环境下的典型以Tag著称的网站主要是:Del.icio.us(美味书签网站)、Youtube、豆瓣网。这些网站都提供了标签管理、搜索和云图等功能,为用户了解网站上的热点提供了新线索。
三、图书馆2.0在信息服务中的实现途径
(一)RSS在信息服务中的应用
RSS具备强大的聚合功能,通过RSS可以搭建好人与信息之间的桥梁,起到“信息中介”的作用,为个性化信息服务创造了条件。
1.利用RSS可实现图书馆的“一站式检索”
图书馆2.0可以通过RSS整合图书馆的既有资源,并进行知识的推送定制服务,从而实现图书馆信息的“一站式检索”。RSS聚合门户是将一定主题和学科内容的RSS 源进行有效组织和集成,并提供一站式的信息服务,用户只需要通过访问聚合站点就可检索浏览相关网站所提供的全部信息。图书馆通过利用Lilina、SXNA 等开源软件来构建RSS 聚合门户,提供学科主题信息服务,可以突破传统学科信息门户静态化、不能自动更新的缺点,使学科信息服务能够及时跟踪最新发展,并在第一时间提供给用户。
通过RSS服务,可将各图书馆的馆藏书目在同一个平台上为读者提供服务, 从而实现各图书馆馆藏资源的聚合。现在,学科导航服务已经成为当前图书馆最主要的服务形式之一,该系统的研制一般是收集因特网上的各类学术性资源,在本地形成学科导航数据库,再提供给读者。利用RSS可以很好地完成这项工作。一方面可以有选择地对Internet上的RSS feed 资源进行搜集,并对搜集来的RSS Feed资源进行整理归类,然后将这些资源整合到图书馆系统中;另一方面再通过RSS feed服务提供从图书馆系统到用户端的内容服务,使RSS技术得到充分利用。
2借助RSS开展信息推送服务,实现个性化定制服务
由于RSS技术具有及时更新、主动推送的特点,可以利用RSS技术根据读者的兴趣和偏好将用户关心的图书馆信息资源的动态以及图书馆服务内容的变化及时主动推送给用户,如图书馆最新信息发布、新书新资源通告等等。RSS 聚合和更新的内容、频率、内容源、关键字等完全由用户在本地主动设置“噪音”、信息的干扰被自动排除在外。目前很多图书馆利用RSS开展信息推送服务,例如:国外的Oklahoma大学图书馆通过RSS feeds 向读者提供最新消息通告、新书通告、新增电子资源通告服务;麻省理工学院提供图书馆新消息的RSS订阅服务、期刊目次的RSS订阅服务及资料库订阅服务。
3.构建与读者沟通的新平台,营造博客空间
RSS 技术在加强图书馆员与读者之间的沟通、交流方面有着广阔的利用空间。图书馆可以在主页上建立图书馆博客,构建与读者沟通的新平台。RSS目前最广泛的应用是在博客中。RSS是描述博客主题和更新信息的最基本的方法。为了更好地发挥图书馆的优势,不断完善信息导航服务,图书馆应鼓励那些有坚实的专业基础、良好的信息素质、思维敏捷、勇于创新及乐于共享的图书馆员率先尝试做Blogger,创建重点学科Blog 站点,在这其中RSS 可充当知识和信息的"过滤器",例如国家科学数字图书馆图书情报学科信息门户所提供的RSS Feed 就是希望将关于图书情报学科的各类新闻、研究进展等信息及时提供给用户。
成熟而完善的Blog可以继承多种个人知识组织的工具,博客为用户提供了一个独立评论、知识组织管理、知识共享的平台。博客主人在做自己的知识整理同时,也在为其他网络访问者提供知识。因此,要更好地发挥图书馆网站提供信息服务的功能,可以在图书馆主页建立各种博客链接,提供各种学科主题的博客圈。借助Blog建立这种人际网络、知识共享的机制的思想,图书馆2.0提供用户个人图书馆的blog空间,也进一步提升了服务空间。
1.馆员和读者共同参与到图书馆管理中
由于图书馆员每天“各自为政”,彼此交流的机会甚少,通过博客,工作人员可以交流工作中出现的问题和困难,共享信息,同时,也进一步增强了领导与员工之间的相互理解与相互信任。
2.博客帮助图书馆进一步实现知识共享
知识共享是指通过各种手段和方式,将组织的个体知识与组织中的其它知识个体所分享,并进一步把个体的知识转化为组织的知识。具体地讲,知识共享能使图书馆更快地获取创新所必需的知识,不仅使图书馆能迅速响应信息社会不断变化的需求,保证创新的顺利实现,而且还能加强图书馆员与读者之间的联系,从而为读者提供个性化服务;通过共享经验、教训和最佳实践,可以防止重复劳动,提高知识的生产效率;还可以减少或杜绝重复性错误,避免错误成本;加强内部各职能部门之间知识的协调和沟通,既增强交流与合作意愿以及团队精神,又可获得连续和快速的工作流程,对图书馆创新十分有利。
3.通过博客推进学科化服务
图书馆可以建立学科馆员博客系统,鼓励各个学科的学科馆员、各界知名教授和一些比较积极的研究生在该系统中建立博客。这些博客主要介绍本学科的最新发展动态、各学科馆员和知名教授关注的研究方向以及学生在学习过程中遇到的问题等。全校师生可以通过留言与各博主分享交流各种学术观点和自己在学习中的困惑。通过这些讨论,逐渐在博主与博客浏览者之间形成学术兴趣小组,形成学术圈。
(三)SNS提供图书馆员和用户的网上社区
纵观国内外SNS的应用,社会性网络被用于图书馆服务已经有较为成熟的实践案例,主要成果表现为一些标志性网站的建立和应用,如MySpace社会交友网络,以Second Life 为代表的虚拟三维世界“图书馆之城”,以豆瓣为标志的社会读书生活分享网站等。
1. MySpace在图书馆服务中的应用
MySpace 是美国一个相互沟通及结识新朋友的社会交友网站。MySpace 网站上,用户可以展示自我,与世界各地拥有共同兴趣爱好的朋友讨论彼此感兴趣的话题、分享照片、分享心情。MySpace 中的注册用户,有相当一部分是图书馆的潜在用户。美国《图书馆杂志》撰文称MySpace 将变成图书馆场所。从图书馆MySpace 的实践来看,目前已经有很多大学图书馆加入到MySpace 的社交网络中。巴那德大学图书馆、布鲁克林大学图书馆、乔治亚技术图书馆、休斯顿大学图书馆、肯塔基大学图书馆等纷纷在MySpace 中建立自己的服务站点。
 2.Second Life 中的图书馆服务
Second Life(中文译为“第二生命”) 是全球最大的虚拟三维世界,它是一种完全模仿现实生活的社区交友型网络游戏。Second Life 中每一个虚拟形象的背后都是一个真实人物。由于Second Life 在美国社会人群中非常受欢迎,许多图书馆、图书馆自动化系统的厂商等都纷纷介入到这个虚拟世界,并逐步拓展图书馆服务。如今,有许多用户不愿意“长途跋涉”去图书馆查找信息,这些用户加入Second Life 虚拟空间中,可以获取虚拟和现实中的各类信息,这些潜在用户决定着图书馆的未来。
Second Life 中的图书馆用户可以像在现实生活中走进图书馆那样,身临其境地分享馆内海量信息资源,参加图书馆提供的各种主题课程和讲座。用户向馆员提出信息服务需求和咨询问题,其中有一半是来自好奇的图书馆员、教育者及学生,但另一半的人是Second Life 上的居民,他们就如同在真实的世界一样,遇到问题就到图书馆找寻答案。
3.豆瓣网无形中拓展了图书馆的影响力
豆瓣网可以算作是国内做的比较成功的SNS网站,它是一个以用户个人为中心,鼓励用户参与的社会性网络工具,其创建目的就是实现兴趣相同者之间的阅读分享与互动。豆瓣网最早的内容是书,现在豆瓣无论从用户的兴趣和提供的内容方面都很广泛,有电影、音乐、博客、展览、讲座,以及各种类型的线下活动内容。豆瓣也可看做是一个推荐的网站,用户之间互相推荐好的东西,豆瓣用算法向用户推荐。在豆瓣网上,用户自由发表有关书籍、电影、音乐的评论,可以搜索别人的推荐,所有的内容、分类、筛选、排序都由用户产生和决定,甚至豆瓣主页出现的内容也取决于用户的选择。用户参与的越多,收获也就越多。
豆瓣中的各种群组可以提升此类群组的知名度,如豆瓣上就有很多图书馆的群组,这些群组定期发布图书馆的新书、讲座信息,在一定程度上拓展了图书馆的影响力和知名度。
(四)Tag标签丰富读者的个性化需求体验
1.Tag标签增加了读者用户的个性化体验
图书馆2.0平台能提供用户实时反馈的定义标签功能,通过Tag标签功能使图书馆系统成为一个更加人性化的检索系统。其基本思路是:在用户根据系统认可的专业关键词检索到结果以后,提供一个可以自定义标签的窗口,如Goog1e提供翻译功能的同时,在用户浏览译文的时候,可以看到:“我有更好的翻译译文”,如果该用户确实能译出比Google提供的译文更好的内容,则用户可以点击这个按钮,然后输入自己的翻译,系统就会用新的译文替代前面的译文。对于图书馆检索系统而言,利用关键词进行检索后,可以在返回结果的界面中写入:“我的tag”程序,用户点击之后可以输入自己认为更方便理解的关键词。这样周而复始,图书馆系统的检索系统就会演变得更加人性化、平民化。
2.图书馆2.0实现标签服务的技术准备
一方面,图书馆要应用Tag标签服务,需要升级LIS系统,通过第三方来完成标签服务。目前广受欢迎的系统是Library Things for Libraries。Library Thing是2005年8月创建的一个个人书目网站,其出发点是通过标签进行书目分类和分享,为用户提供一个简单以用的图书馆管理站点,让用户可以更好地管理自己所阅读的图书和个人藏书。由于library thing贴心的功能,并且能和图书馆目录、网上书店进行集成,已经成为了目前世界上最大的、拥有超过300,000位成员的网上图书俱乐部。
2007年4月网站正式推出Library thing for Libraries,简称LTFL,专门为图书馆提供Web2.0服务,采用在图书馆OPAC页面中嵌入HTML代码的形式,为图书馆提图书馆封面、标签、评论和评分,相关版面等功能,从而聚合图书馆读者和Library Thing的用户,提供更好的书目信息服务。
另一方面,图书馆需要部署具有标签功能的开源系统。
VuFind是美国宾州Villanova大学图书馆开发的图书馆资源门户,目标是取代传统OPAC,使用户能检索、浏览所有图书馆资源,包括馆藏目录、数字资源、机构存储和图书馆其他的收藏。VuFind采用完全模块化的设计,使用开源Solr作为数据搜索引擎,提供丰富的Web2.0功能。VuFind在GPL框架下开源,用户还可以免费使用并对其进行修改,目前国外许多图书馆已经应用开始VuFind提升自身的服务。
(五)图书馆2.0环境下的参考咨询服务
参考咨询服务工作是图书馆读者服务工作中的核心内容,参考咨询馆员利用IM,Tag,Rss,Blog,Wiki,Mashup 等各种Web2.0 技术为用户服务,出现了馆际合作、馆藏共享、馆员共享、图书馆联盟等多种咨询服务方式。与以前的参考咨询服务相比,基于Web2.0 的参考咨询更多地重视咨询系统和咨询活动的社会性,重视其开放性与互动性,重视交流与沟通,重视用户的体验和参与,以及鼓励用户创建内容、分享知识与智慧,并且图书馆提供支持用户个性化和多样化的需求服务的强大能力。图书馆2.0模式下的参考咨询服务主要可以通过如下几种方式来实现:利用RSS技术帮助用户使用资源;二是通过WIKI技术来帮助进行网上实时参考咨询。
1.利用RSS做好参考咨询工作
如何利用RSS 技术帮助用户更好地使用资源和提供信息服务以及做好参考咨询工作,是新型图书馆工作必须应对的课题。但传统的参考咨询服务实际上是一种非自助式的(如:bbs,email 和即时聊天),需要用户与咨询馆员之间通过互动交流才能完成。而自助式参考咨询服务则是指参考咨询员首先对馆内信息资源和馆外相关信息资源进行整理,加工分类,使之形成可直接搜索查找的资源,用户无需与咨询馆员进行交流就能自己查找所需信息自行解决问题。RSS 在图书馆参考咨询服务中的应用,使自助式参考咨询服务成为可能。一方面可以通过强大的聚合功能为用户提供大量的信息资源, 另一方面可以通过推送技术主动为用户提供服务, 对用户和馆员都有很大的应用价值。用户可以通过关键词订阅或分类订阅的方式, 从图书馆参考咨询服务网站的RSS 页面了解相关信息。咨询馆员则可通过定制多个RSS 提要,从多个信息源收集与咨询问题相关的信息, 并可以主动推送给用户。
2.利用Wiki系统开展数字参考咨询
图书馆使用Wiki系统进行数字参考咨询的数量也在日益增加。访问Wiki 的要求只是和Internet 连接一个Web 浏览器, 因而比其他一些协作应用程序与组件容易部署和使用。通过将信息用户所咨询的问题及解答答案共享在信息页上, 还可以减轻邮箱的负荷,减少咨询专家与信息用户之间的电子邮件发送数量。另外,Wiki 技术还可以实现对图书馆规章制度的动态维护、信息用户意见反馈或者是留言板服务。
(六)图书馆2.0下的知识服务社区
无论是RSS的新闻聚合,还是嵌入到图书馆服务中去的博客式嵌入式服务、SNS下的图书馆网上社区、Tag标签的丰富体验信息提供,它们都是集合了Web2.0技术环境下的理念体系,将这些新思路、新创意融入到图书馆服务的各个环节中,构建图书馆平台下的网络知识社区,提供更人性化、更加便捷化、更加高质量的信息服务。
一个完整的图书馆2.0服务应该能集成所有Web2.0技术,并搭建起图书馆2.0 下的知识服务社区。通过图书馆1.0环境下已有的各种馆藏资源、新增加的博客资源、Wiki讨论组构成图书馆的资源体系;馆员和用户则可通过各种Web2.0应用模式如博客、Wiki、RSS、SNS、Tag、AJAX技术等进行实时的信息交互与分享,从而搭建起图书馆2.0的网络知识社区。如图10-2-1所示:
文本框: E-mail文本框: 电话文本框: IMl
图10-2-1图书馆2.0的网络知识社区
(来源:王利萍,成全,刘勇.图书馆2. 0 网络知识社区构建[J].情报杂志,2007(12):150-154)
因此,图书馆2. 0 的功能实现是在图书馆原有信息服务功能基础上的进一步深化,通过借助Web2.0 的核心技术来实现功能的拓展,用户则由以前被动接受图书馆已存信息的从属角色转变成为图书馆信息资源创建与发布的主体地位,同时也印证了Meredith Farkas 对图书馆2.0 所做的归纳:图书馆2.0 是图书馆服务范式的转变;是关于无缝的用户体验;是图书馆成为知识社区的实际存在。
四、图书馆2.0的应用实例
自图书馆2.0的理念思想推出至今,国内外很多知名图书馆都开展了许多图书馆2.0功能与服务上的尝试,潘林在2006年发表的《图书馆2.0在门户网站中的应用现状及实践研究》总结了Web2.0技术在中国图书馆领域的应用现状,如下表所示:


 
表10-2-1 Web2. 0相关技术在中国图书馆领域的应用现状

 

技术类型
使用该技术的图书馆
总数(所)
RSS
清华大学图书馆、上海大学图书馆、厦门大学图书馆、中国科学院文献情报中心、国家科学数字图书馆、武汉理工大学图书馆、北京理工大学图书馆、南京财经大学图书馆、成都航空职业技术学院图书馆、台东大学图书馆、长庚大学图书馆、台湾大学图书馆、淡江大学图书馆、高雄医学大学图书馆、交通大学图书馆、中国文化大学图书馆
16
Blog
上海大学图书馆、厦门大学图书馆、国家科学数字图书馆、天津大学图书馆、台湾大学图书馆、淡江大学图书馆、台东大学图书馆、交通大学图书馆
8
Wiki
上海大学图书馆、厦门大学图书馆
2
Tag
 
0
Sns
 
0

 

 
通过上表我们可以看出,2006年大多数图书馆已经开始了RSS在图书馆的信息推送、定制服务;2006年至今更多的图书馆投入到图书馆2.0的事业当中,开始应用更多Web2.0技术到图书馆服务中,如SNS技术在图书馆的应用,Tag标签用于图书馆系统的检索服务,增加用户的体验。
清华大学图书馆比较早地开始使用RSS技术推送信息服务,开通了新书通告RSS和图书馆最新动态RSS。开展新书通告RSS服务,能够将新书书目及时主动推送到读者的桌面,读者无需访问网站就能得到更新的内容,图书馆已将所有新书信息,按社会科学、法律、经济、艺术、自然科学、医学、工程技术、综合和西文9大类自动生成RSS Feed,读者可根据自己所关心的学科领域和兴趣有选择地订阅新书书目。开展图书馆最新动态RSS,有助于将图书馆最新信息及时推送到读者桌面,能够使读者在第一时间了解图书馆的最新动态,提高服务水平。
厦门大学是较早介入到图书馆2.0的图书馆之一,成立泛技术小组,融合RSS技术、WIKI百科功能,建立了厦门大学知识资源港。
一方面,厦门大学图书馆充分利用RSS技术,建立了图书馆界的图林网志聚合,厦门大学网络图苑的图林博客集中搜集了122位我国图书馆学人的博客,这些专业博客已经成为我国图书馆学学术交流的重要阵地。通过RSS技术将图书馆界各个专家的博客聚集在此平台下,便于学术界专家们交流新思想、新理念;也便于有信息需求的用户通过图林博客了解图书馆的服务与业务,在一定程度上也起到了咨询服务的功能。
另一方面,厦门大学图书馆开通的虚拟参考咨询服务,融合了各学科馆员的博客信息、RSS推送技术、IM和Wiki共同协作平台,使参考咨询服务由传统的“以资源为中心”转向“以用户为中心”,使读者参与图书馆服务的方式和范围都得以丰富和拓展,使得同步咨询更加及时,也加深了使读者与图书馆的紧密联系,使图书馆的资源利用率极大提高。
1.引进Wikipedia,建立学术百科
上海大学学术百科采用的是PHP+MYSQL构架。其建立的过程如下:首先,学科馆员和一部分学科兴趣小组成员,将新闻聚合系统中有价值信息以及从其他渠道获得的学科知识信息按条目整理到学术百科系统。其次,该学科的学科小组成员、教师以及访问者按权限对不准确的条目进行修改。最后,由学科馆员以及特聘的学科权威对更改不恰当的条目进行再更改或者恢复,而后锁定条目,形成相对准确的条目。学科馆员要定期对有变动的信息进行微调。这样,一条相对准确的学科信息就在学科馆员、学科兴趣小组成员、学科权威、学科信息使用者的共同协作之下诞生了。
2.构建博客系统,加强读者参与图书馆知识管理,推进学科化服务
上海大学图书馆博客系统是基于PHP WIND BLOG V4.0的多用户的博客平台,并在此基础上进行再开发,根据自身需求加入了一些新的功能,最终形成了上海大学图书馆博客系统。该系统采用PHP+MYSQL构架,在提高访问速度和使用效率的同时提高了安全性。系统分为博客读者界面、博客所有者管理界面和后台系统管理界面三大板块。博客读者界面为读者提供最新博客排名、最新博客文章排名,多途径检索等多种服务,使读者能够迅速找到自己感兴趣的日志。
此外,上海大学图书馆还对所有日志按学科进行了分类,以方便读者访问。在博客所有者管理界面中,博主可以修改博客资料,发布博客日志和照片,将博客文章分类,管理自己的学术小组等。
学科馆员博客主要是整理本学科的发展信息,回答学生在本学科学习过程中遇到的问题,并组织本学科的学科小组。各学科教师博客发布博主在自己学科领域关注的热点以及自己从事的研究方向信息,并与感兴趣的读者形成互动,在这种互动过程中逐渐形成学习圈。研究生博客可以从学生的角度关注自己学科的发展,总结学生在学科学习过程中遇到的以及可能遇到的种种问题,并解答这些问题。这样就形成了一个以学科馆员博客为定位基点、各学科教师博客为中心节点、研究生博客为支撑点的学科知识网络。
3.上海大学图书馆的新闻聚合系统
上海大学图书馆新闻聚合系统是是以开源新闻聚合系统SXNA 1.5为基础,在原系统的基础上做了适当调整,系统采用ILS+ASP的构架。其内容主要分4块:(1)馆内信息以及个性化服务。主要聚合上海大学图书馆发布的新闻和图书借阅方面的相关信息。(2)国内外图书馆界的著名博客。主要聚合国内外著名的图书情报界博客,以提高馆内研究水平,方便馆内研究人员与其他同行的交流。(3)学科馆员博客和国内专家博客。以配合学科建设为目标,将图书馆的学科馆员博客通过RSS信息聚合起来,方便读者使用。此外。还汇集了国内比较活跃的学科博客群体,以促进读者与其他院校学者的交流。(4)热点博客。重点收集当今学科发展的某些焦点领域的博客。其界面如下:
图10-2-2 上海大学图书馆新闻聚合系统
通过融合Web2.0的技术和思维理念,集成了学科馆员、信息聚合、博客、Wiki、学科导航、虚拟社区等技术,上海大学图书馆建成了图书馆2.0环境下的学科知识服务平台,其示意图如下所示:
图10-2-3上海大学图书馆学科知识服务平台
(来源:陈新艳.基于Library2.0的学科馆员服务模式创新研究[J].武汉理工大学学报,2009,31(8):173-175)
WebOPAC服务被称为目前最活跃的图书馆2.0应用。Web OPAC采用插件、Ajax等2.0技术,集成了多种资源和服务,是图书馆2.0下信息集成服务的重要方式。目前国内外的不少图书馆,如北卡莱罗纳州立大学图书馆、加利福尼亚大学图书馆、厦门大学图书馆、暨南大学图书馆、上海图书馆等都在WebOPAC上进行着积极的服务拓展。
OCLC OpenWorldCat(OWC)是最大、最复杂的全球性联合目录数据库,目前已拥有来自18,000多成员馆的6,000万条书目记录和1.3亿馆藏。从2000年起,OCLC开始进行OWC项目研究,目的是建立图书馆网络与万维网之间的重要连接点,使图书馆的馆藏和服务通过Yahoo、Google等常用搜索引擎即可获得。作为全球最大的书目数据库,OWC较好地运用了图书馆2.0的理念和技术,集成了大量的服务功能,主要表现在:(1)重视用户的参与,根据用户的需求、信息搜索习惯设计功能及界面,增强了用户的参与;(2)将外部资源和服务整合如数目系统中,在自有资源基础上,OWC不仅整合了用户编写的信息,还整合其他授权的电子资源、图书网站等中多资源,还提供各种便捷的信息查找入口,还和Amazon等网上书店做了接口,用户可以在图书馆网站上购买新书;(3)将自由资源和服务整合入外部系统中,用户可以自己建立WorldCat链接,在URL中加入检索词可方便地进行单字段检索,并且对外开放HTML代码,读者注册后,即可获取代码,将WorldCat检索框添加到自己的主页或网站中去。这些强调用户的积极参与的服务方式,进一步拓展了OPAC检索系统的性能和可用性。
理论通往实践的历程中总是充满了挑战,图书馆2.0的兴起是图书馆未来发展前景中的主要应用模式,也是万千图书馆界研究人员一起努力创新的结果。“2.0”作为一种标签,它涵盖了“精神”和“技术”两个层面,终极目的是为用户提供服务。因此,未来图书馆的信息利用与挖掘离不开2.0的精神与技术,2.0精神与2.0技术应用的结合就能更好地提升用户服务,提升用户获取有价值的信息的能力,增加用户对图书馆的忠诚度,可以更好满足用户在查找信息过程中的最小省力法则。与此同时,Web2.0的应用工具也为图书馆员提供了更多展示、学习、交流的平台,开拓了自身的视野。图书馆2.0所倡导的开放共享的理念,使图书馆员和用户不再孤立存在,可以彼此进行更多地分享、学习与合作。
第三节 知识检索与信息可视化
信息检索作为一门学科,其历史可追溯到20世纪中期。在此之前,信息存储和传播主要以纸质介质为载体,信息检索活动也围绕着文献的获取和控制展开。自1946年世界上第一台电子计算机问世,计算机技术便逐步走进信息检索领域。随着信息技术、数字化技术、网络技术的发展,信息检索先后经历了脱机检索、联机检索、光盘检索,再到目前的网络检索阶段,促进了信息检索理论与实践的发展,同时也给信息检索带来了新的挑战。目前网络信息资源纷繁复杂、类型多样,如何从海量、异构的网络信息资源中快速、准确、高效的检索并识别所需信息,是当前信息检索人员、数据库开发人员面临的重要问题,而知识检索、信息可视化研究是解决以上问题的重要途径。
知识检索是为了解决目前信息检索中存在的诸多问题而提出的一种新的信息检索理念。由于目前数字资源的组织依旧停留在信息层面上,由信息组织机制直接引发的信息检索的弊端是显而易见的:一方面,基于关键词匹配的信息检索技术无法达到对知识的检索与利用,容易产生大量的信息冗余和信息丢失;另一方面,检索结果基于简单的时间线性排列,无法实现语义相关性排序。尽管一些数字资源检索系统引入了主题词典或概念词典,但其描述知识的能力非常有限。由此导致的结果是,众多的数字资源系统依然是异构、多源和分布的,数量巨大的数字资源与人们有效接收能力之间的矛盾不仅没有缓解反而日益突出。为此,创新信息检索理论方法与技术,从信息检索走向知识检索势在必行。
知识检索作为一个新兴的研究领域,近年来受到了较多的关注,但国内外关于知识检索尚未形成一个学界公认的权威定义。目前对知识检索概念的理解有以下两种视角。
1.知识组织的视角
知识检索是为了适应知识组织的发展趋势,以解决信息检索效率低的弊端而提出的一种新的检索理念。知识检索是指在知识组织的基础上,从知识库中检索出知识的过程,是一种基于知识组织体系,能够实现知识关联和概念语义检索的智能化的检索方式。
2.知识处理的视角
知识检索是综合应用信息管理科学、人工智能、认知科学及语言学等多学科的先进理论与技术,融合知识处理和多媒体信息处理等多种方法与技术,基于知识和知识组织,充分表达和优化用户需求,能高效存取所有媒体类型的知识源(文本、图像、视频、声音等),并能准确精选用户需要的结果。
不管上述何种视角,知识检索均体现出两个显著特征:一是基于某种具有语义模型的知识组织体系,知识组织体系是实现知识检索的前提与基础,知识检索则是基于知识组织体系的结果;二是对资源对象进行基于元数据的语义标注。元数据是知识组织系统的语义基础,只有经过元数据描述与标注的资源才具有长期利用的价值。以知识组织体系为基础,并以此对资源进行语义标注,才能实现知识检索。
与信息检索相比,知识检索具有明显的优势:①实现了语义和概念层次上的标引,能够提高查全率和查准率,降低用户的检索负担。如美国国立医学图书馆开发的一体化医学语言系统(UMLS)由超级叙词表、语义网络和专家词典三部分组成,其中语义网络包括132种语义类型和56种语义关系,UMLS对于提高PubMed智能检索性能起到重要的作用;②实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析、预测后的超前性领域成果或知识。如GoPubMed系统在提供文献检索的同时,对文献结果基于基因本体(GO)、医学主题词表(MeSH)以及蛋白质数据仓库(UniProt)进行内容分析,辅助用户了解生物医学领域研究动态;③提供主动服务方式,如,主动给用户以智能辅助,主动学习用户知识并自动优化用户需求,以及主动提供个性化检索;④集成和综合应用各类知识和各种高效的智能与非智能技术,全面提高检索效率。
需要指出的是,知识检索并不等于基于知识的信息检索。基于知识的信息检索是指在信息检索的框架下,通过一些智能化手段,改善检索效率和效果的一种方式。目前学界所提出的“概念检索”、“语义检索”、“智能检索”都是基于知识的信息检索的表述形式。
知识检索的提出给20世纪中期以来形成的信息检索理论带来根本的变革与挑战,也使异构的、分散的却在语义上关联的数字资源的高效获取与利用成为可能。这一功能的实现有赖于系统化的基础与技术支撑。我们认为,知识检索的基础在于知识组织体系。同时,近年来信息检索与人工智能领域新出现的自然语言处理(Natural Language Processing, NLP)、语义网(Semantic Web)、智能代理(Intelligent Agent)等技术也是知识检索得以实现的必备条件。
1.知识组织体系 所谓知识组织体系,是对资源内容概念及其相互关系进行描述与组织的机制(工具),是用以定义并组织知识的一套概念和符号的集合,是资源语义模型的形式化。目前,知识组织体系主要有以下两种。
(1)主题词表和分类表:这是目前图书情报界公认的知识组织体系。主题词表(如MeSH)侧重于词义消歧和同义词控制,分类表(如中图法)侧重词汇等级关系的控制。目前的主题词表和分类表已经具备了以下功能要素:①具有一套从领域知识中抽象出的概念体系;②可用形式化方式表示概念体系并可随时扩充概念层次和结构;③支持资源对象基于语义层面的标引;④可用知识网络/概念地图的方式展示知识结构。但主题词表和分类表还不能精确描述概念语义和多维关系以及支持公理定义和语义关系的推理,只是一种初级的知识组织体系。
(2)本体(Ontology):源于哲学领域,本体的实质就是要提供一个明确的形式化地定义术语含义及术语间关系的语言。本体包括分类和一套推理规则。分类用于定义对象的类别及其之间的关系,推理规则则提供进一步的功能,以精确地表示那些隐含(或不明确)的信息。目前还没有覆盖所有领域的本体,应用最为广泛的是领域本体(如基因序列和结构领域的基因本体)。与主题词表(分类表)不同的是,领域本体是领域知识规范的抽象和描述,可以构造丰富的概念间的语义关系,能够准确描述概念含义以及概念之间的内在关联;本体形式化能力强,同时具有高度的知识推理能力,能通过逻辑推理获取概念间蕴涵的关系。因此,领域本体是一种知识组织体系。知识组织体系的形式和能力在相当程度上决定了知识检索的能力,以领域本体作为知识组织的技术和方法,才能实现基于语义的知识检索。
2.语义网(Semantic Web又称第三代互联网,是对当前互联网(Web2.0)的一种扩展。针对目前因特网在信息表达、检索等方面存在的缺陷,Internet的缔造者Berners-Lee于2000年提出了下一代因特网的概念——语义网。
语义网的关键技术有4点,即元数据(Metadata)、可扩展标记语言(eXtensible Markup Language,XML)、资源描述框架(Resource Description Framework,RDF)以及本体(Ontology)。语义网的核心是元数据,它通过在现有Web基础上增加标准的、共用的、机器可理解的元数据,使得原来Web环境下难以实现的许多应用成为可能而且变得有效。语义网的语言标准包括XML、XML Schema、RDF和RDF Schema等。本体通过对术语的严格概念定义和术语间的关系来确定术语的精确含义,用于表示共同认可的、可共享的知识,从而产生计算机可理解的语义,因此本体是解决语义层次上的信息交换和共享的基础。
尽管国内外研究人员对语义网开展了大量研究,但对语义网的实际发展方向还没有十分明确的规程和描述,主要原因在于语义网的实现还面临着诸多挑战:①内容的可获取性,即基于Ontology而构建的语义Web网页目前还很少;②本体的开发和演化,包括用于所有领域的核心本体的开发,开发过程中的方法和技术支持,本体的演化及标注和版权控制问题;③内容的可扩展性,即有了语义Web的内容以后,如何以可扩展的方式来管理它,包括如何组织、存储和查找;④如何实现多语种支持;⑤本体语言的标准化,即本体的认可度问题。
3.智能代理(Intelligent Agent智能代理是可以在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂工作的代理软件,如信息查询、筛选、管理,并能推测用户的意图,自主制定、调整和执行工作计划,是实现知识检索自动化、智能化的基础技术。
4.语境检索(Context Retrieval语境检索集成检索技术、查询提问和用户信息,为用户需求提供最佳答案。语境检索涉及时间维度、社会维度和工作背景三大语境维度,提高了检索的语义、语用匹配程度,一定程度上弥补了传统检索技术返回结果相关度差的缺陷。
5.自然语言处理(Natural Language Processing自然语言处理通过对自然语言文字与话语的语法、语义、语用进行分析,有助于实现基于语义而非关键词的检索。在知识检索中的作用表现在结合语境实现词义消歧,进行文档信息抽取,从文献语料库中抽取明确的自然语言提问答案。此外,自然语言处理已大量应用于自然语言接口,人-机交互模拟人—人交互的认知功能,实现用户与系统之间更充分的交流、理解、学习与协作。
现有Web环境下的信息资源存在的问题包括以下三个方面:①格式上的异构性;②语义上的多重性;③关系上的匮乏性和非统一性。因此无法实现信息资源的互联和互操作,用户不能实现知识检索,导致了知识共享与知识服务的低效率。本部分以吉林大学刘昆等建立的“语义网环境下的知识服务系统模型”为案例,说明知识检索的实现机制与过程,见图10-3-1
图10-3-1 语义网环境下的知识服务系统模型
(来源:刘昆,刘秀梅,刁云梅. 语义网环境下的知识服务系统模型研究[J].现代情报,2008,28(2):142-145
1.用户需求 该模块采用可视化网页的形式,主要负责接受用户的信息需求,同时接收知识服务系统返回的检索结果,是用户和知识服务系统之间进行交互的界面。
2.智能代理 代理程序通常部署在每个需要信息交换的客户端设备中独立运行,主要完成本地信息采集、信息处理、接收服务器发送信息指令、指令解析、指令执行、提供数据转换、共享接口等功能。本模型中的代理主要负责将接收的用户信息需求,利用相应的描述语言进行基于领域本体的语义描述。并且利用智能代理,通过监视用户的信息查询过程来自动获得用户信息需求的个性化特征。在用户的终端上运行一个负责监视的信息代理,信息代理将用户在Web上浏览时的信息行为收集起来,并将相关信息不断传送给远端的服务器,服务器对信息进行组织和整理,从中分析出用户的信息偏好,并预测出用户的信息需求,进而提供主动的知识服务。
3.领域本体 以学科领域为背景进行Ontology的构建,是实现语义网环境下的知识服务的核心和基础。通过分析领域内概念及其相互关系,建立相应本体库,重点解决定义描述领域知识、语义清晰、知识重用、结构含义等问题。
4.推理引擎 目前已有一些基于本体语言的推理引擎。这些推理引擎首先得到系统所需使用的所有的推理规则和策略(一般对应于系统所面向的本体语言),然后把这些规则和策略转化为推理系统内部的推理过程语言格式。
5.统一的信息资源空间 良好的知识组织是实现知识服务的基础,将知识库整合在统一的信息资源空间中,在语义与知识的层次上实现互联网上信息资源的全面连通交互与共享,特别是Web信息或知识在语义级的精确表达、互操作与集成。在语义网环境下,可以在语义层次上实现Web环境中异构空间信息的互操作与集成,解决空间信息共享的问题。
6.智能查询 通过对统一信息资源空间的智能查询,得到符合用户信息需求的知识产品。在语义网环境下,基于语义的检索是在知识层面上进行的,计算机可以理解概念之间的内在联系,因而能够发掘出那些隐含的、不明确的信息和知识。同时领域本体中对同一概念可以映射到不同的词条,因此能够很好地解决“一词多义”和“一义多词”问题,实现检索需求的“忠实表达”,从而在查全率和查准率方面更好地满足用户需求。通过领域本体和知识库为信息源提供必要的语义标注信息,从而使系统对领域内的概念、概念间的联系及领域内的基本公理知识有一个统一的认识,进一步提高了系统的联想能力和精确性,因此能够为用户提供更有价值的知识产品。
当今社会已进入信息化时代,其本质特征是信息的数字化。随着计算机硬件与网络技术日新月异的发展,数字化信息已呈现出爆炸性增长的态势。面对这些纷繁芜杂的海量数字信息资源,如何进行信息发现和知识挖掘,发现、揭示、展现其中的信息本质特征与规律,需要科学的方法、先进的技术和有效的工具。信息可视化(Information Visualization)作为情报学重要研究领域之一,在清晰、准确、展示信息检索过程、信息分析内容方面具有重要的意义。
信息可视化的产生是沿着科学可视化、数据可视化、信息可视化的过程发展而来。信息可视化这一概念最早由计算机图形协会成员McCormick在1987年正式提出,20世纪90年代以来,国际上对信息可视化进行了广泛而深入的研究,并取得一些重要进展。
所谓信息可视化,就是利用计算机支撑的、交互的、对抽象数据的可视化表示,来增强人们对这些抽象信息的认知。信息可视化实质上是一种信息转化处理过程,它旨在将信息从某种原有形式转化为一种视觉形式,以充分利用人类对可视模式快速识别的自然能力对信息进行观测、浏览、判别和理解,从而将信息处理过程中人类承担的较多的识知负担转变为相对容易完成的感知任务。
从定义中不难发现,信息可视化是处于在数据、计算机和用户之间的一类交叉的活动,其核心是数据探索,主要起到三方面的作用:①形象地表达信息,即将抽象数据用可视的方式来表示;②发现新的知识;③识别信息在结构、模式、趋势、关系等方面的各种可能的规律。通过探索,人类可以从浩瀚的数据海洋中获取有用的信息,从而在信息中发现知识,从知识中寻求决策。
信息可视化技术的核心是为用户提供直观的、可交互的信息环境。同一般科学计算可视化比较,信息可视化具有以下主要特点:
1.直观形象性 信息可视化是通过生动、直观、形象的图形、图像、影像、声音、模型等方式,把各种信息展示给用户,以便进行图形图像分析和信息查询。
2.多元数据的采集与集成性 运用信息可视化技术,可方便地接收与采集不同类型、不同介质和不同格式的数据。不论它们被收集时的形式是图形、图像、文字、数字还是视频,也不论它们的数据格式是否一致,都能用统一的数据库进行管理,从而为多源数据的综合分析提供便利。
3.交互探讨性 在大量数据中,交互方式有利于视觉思维。在探讨分析的过程中,可以灵活检索数据,可以改变信息交互方式。多源信息集成在一起,并用统一数据库进行管理,同时具有较强的空间分析与查询功能,因此用户既可以方便地调整可视化变量(如轴系、颜色、高度、阴影、视角、分辨力等场景参数)获得信息不同表现效果,又可以方便地用交互方式对多源信息进行对比、综合、分析,从中获得新的规律,以利于规划、决策与经营。
4.信息的动态性 有关信息不仅仅被表现为空间信息,并且具有动态性。随着计算机技术的发展和时间维的加人,使信息的动态表示和动态检索成为可能。
5.信息载体的多样性 随着多媒体技术的发展,表达信息的方式不再局限于表格、图形和文件,而拓展到图像、声音、动画、视颇图像、三维仿真乃至虚拟现实等。
目前信息可视化在地质学、医学、情报学、金融学和通信学等领域都有着十分广阔的应用前景,如地球地质领域的全球定位系统(GPS)、地理信息系统(GIS)、遥感(RS)及其数字地球工程,医疗领域的计算机断层扫描(CT)、核磁共振图像(MRI)及可视化人体计划(VHP)等。在数据库检索系统、数字图书馆中,信息可视化主要包括以下几个方面的内容:提问式构造可视化、检索过程可视化、检索结果可视化和文献信息分析可视化。
1.提问式构造可视化  提问式构造可视化是通过检索接口或检索界面,对检索词及其逻辑组配关系进行某种直观的、可视化的显示和表达,辅助用户更轻松、准确地构造出符合系统语法要求的提问式,从而减少检索交互过程中的认识负担。如新西兰数字图书馆开发的VQuery系统,基于Venn图来辅助用户构造布尔逻辑表达式,每个提问词对应一个圆或椭圆,圆与圆之间可能存在相交或相离2种情形,选取圆的相交部分,则提问词之间是“AND”关系,选取圆的非相关区域,则为“OR”的关系;如果一个词对应的圆出现在界面的活动区域,但未被选择,则为“NOT”关系。
2.检索过程可视化 检索过程的可视化是指把文献信息、用户提问、各类情报检索模型和利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形。如美国斯坦福大学开发的数字图书馆集成工具环境(Digital Library Integrated Task Environment,DLITE)是一个完全图形化的直接操纵检索界面。在DLITE系统界面上,所有对象(如提问式、文献、文献集及检索结果等)都以图形表示,通过对目标对象的拖动来激活并完成一系列操作。
3.检索结果可视化 目前检索结果的可视化研究主要建立在对检索结果集合的分析处理基础上,围绕“显示什么”和“如何显示”开展相关研究。文献检索结果的可视化显示包含两层含义:第一,将文献检索结果用可视化方式,如图形、图像、动画等来显示。如EBSCO数据库除提供基本检索和高级检索外,还提供视觉检索 (Visual Search)功能,检索结果在视觉图形中依主题排序,系统自动将与关键词最相近的数条记录依图形模式组织起来,供用户选择;第二,用可视化方式表达检索内容及其之间的相互联系,揭示检索内容的深层含义。美国加州大学伯克利分校研制的Tilebar可视化检索系统是对文献进行可视化检索的典型系统,它不仅揭示了检索词与整个文档的关系,还深入到文档内容,指出在文档的哪一部分或哪几部分出现了该检索词,出现的频率是怎样的,最后的检索结果是用矩形来表示的,矩形的长度代表文档的长度,矩形的第一行代表第一组检索词在文档各部分的分布情况,第一列代表文档的第一个部分。检索词与文档的联系程度是用颜色来表示的,若矩形中所含的深色方块越多,说明该文档与检索词的相关度越高。
4.文献信息分析可视化 信息可视化是将抽象的数据用可视的形式表示出来,信息可视化与文献计量学方法、聚类分析方法、社会网络分析等方法的结合,生成具有各种属性的科学知识图谱,为清晰准确表达学科、领域、专业、文献、著者间的关系,揭示知识领域的结构、映射知识领域的发展趋势,发现科技研究热点、研究前沿以及文献之间的诸多关系等方面提供了新的手段,成为情报学领域文献信息分析研究的新兴热点。将信息可视化技术应用于文献信息分析有二个比较突出的优点:一是直观可视性,提供了直观理解大量数据的途径,通过可视化辅助用户辨别重要信息。如,利用CiteSpace绘制知识图谱,辅助用户寻找科技发展中的关键点、把握某一学科或知识域的前沿领域;利用专利信息分析可视化软件Aureka生成Thememap图,纵览技术领域布局、揭示技术/竞争对手间的关系等;二是多维性,信息分析可视化可将三维以及多维用直观的方式显现出来,可以看到表示事物的多个属性和变量,从多方面揭示事物间的联系。如,利用SPSS的多维尺度分析,将高维空间的数据通过低维空间(通常是二维空间)展示分析对象之间的联系,并利用平面距离来反映对象之间的相似程度。
第四节 医药卫生决策支持系统
(一)医学信息决策的定义
医学决策就是做出与治疗方案、医学处置和公共卫生政策等有关的一些重要的决定。决策是在相关信息的收集、整理、加工、分析基础上利用的结果,在决策过程中,信息是决策的原料,可靠和充分的信息是做出正确决策的基础。大量的医学决策也是要在信息分析的基础上做出的。
医学信息决策是指在进行医学决策时不仅仅凭经验和直觉、而是经过相关信息分析后所做出的决策。基于医学信息的决策常常比较复杂,具有不确定性和需要进行风险值评估的特点。
(二)医学信息决策的分类
医学信息决策从不同的角度可以分为不同的类型,可以继承决策分类方法,按照决策问题的重要程度或目标层次,分为战略决策、战术(管理)决策和作业决策,按照决策行为划分为个体决策和群体决策。在实际操作过程中,根据不同需要使用不同的分类方法。
1.按照决策对象的范围可分为宏观医学信息决策和微观医学信息决策。宏观医学信息决策是指根据长期的研究分析所制定的一系列医学相关领域和政策法规、标准、操作指南等行为。微观医学信息决策则主要针对具体的个体状况依据信息分析所作出的决策,最常见的就是医生对病人的诊断结论或治疗方案等。
2.按照病情是否曾经出现,可分为结构化医学信息决策、非结构化医学信息决策。结构化医学信息决策是指已形成一套完整的规则,如常见病的诊断、症状判断、治疗方法等。非结构化医学信息决策是指少见或未见过的医学现象,根据现有知识、手段、经验无法作出明确的结论。只能根据当时情况和现有资料,依赖于决策者的经验、智慧来做出决策。
3.按照医学信息来源,可以分为生物信息决策、医学图像信息决策、临床信息决策和公共卫生信息决策等。这是目前较为常见的医学信息决策分类方法,其中临床信息决策与公共卫生信息决策两类研究与应用比较活跃。
(三)医学信息决策过程
科学的决策过程作为人的一种创造性思维活动,是从调查研究开始,经过分析判断,达到对事物客观规律的正确认识,直到做出决定的动态过程。医学信息决策的过程中,医生应用临床技能与经验,迅速确定每一个病人的健康状况,结合病人的期望,根据实践中需要解决的问题,进行有效的信息检索,并对其进行评价,找到最适宜的诊断方法,将最精确的预后估计及最有效治疗方法用于每一个具体病人的服务中,从而改善病人的健康状况,提高病人的生存质量,增加病人的期望寿命。医学信息决策过程主要有以下几种类型:
1.传统的医学信息决策
传统的医学信息决策基于如下基本假设,即非系统的个人临床经验构建医生个人知识的重要方式,基于这些个人经验所采取的关于预后、诊断、治疗等临床措施是合理的。因此,研究并熟知疾病的基本机理及病理生理学原则足以作为临床推理的依据。传统的临床训练与临床知识相结合足以使医生对新的临床诊断治疗方法做出准确评价。每个医生脑中存储了大量的病症信息,通过整合病人资料,能迅速作出识别,快速评价病情,并制订治疗计划。例如,病人出现严重腹痛、血尿、大汗淋漓等病症,医生会立即做出肾绞痛的诊断。
2.循证医学临床决策
循证医学是遵循临床研究证据的医学实践过程。在临床实践中,提倡医生在制定临床决策时,将个人专业技能和经验、病人的需求与当前最好的科学依据相结合。循证临床决策把创证、获证、用证和再评价以及不断完善和更新证据贯穿于临床实践的始终,通过提出问题,收集随机对照试验、确定纳入和排除标准、资料提取、各试验质量评估、统计学处理以及敏感性、失效性分析等严格、规范的系统评价过程,最终得到包括病因、诊断、预防、治疗、康复和预后等可用于临床决策的高质量的决策证据。成功的临床决策是一个由获取信息、评价信息和利用信息组成的循环过程。在上述过程中,由于不断吸收新的信息以及决策方案的执行,决策主体(医生)的知识结构与经验不断更新和完善,对疾病的认知逐渐深化。大量的患者信息和数据也对医师诊疗决策提出了巨大的挑战。而借助计算机的强大存储能力和处理能力有可能改变这一状况,于是临床决策支持系统应运而生。
(一)概述
1.决策支持系统概念
20世纪70年代初期,Scott Morton提出了决策支持系统(Decision Support System,简称DSS)的概念,他将DSS定义为:“一种交互的基于计算机的系统,该系统能帮助决策人使用数据和模型解决非结构化的问题。” 20世纪80年代:Sprague提出了决策支持系统三部件结构(对话部件、数据部件、模型部件),明确了决策支持系统的基本组成,极大地推动了决策支持系统的发展。20世纪80年代末90年代初,决策支持系统开始与专家系统(Expert System,简称ES)相结合,形成智能决策支持系统( Intelligent Decision Support System, 简称IDSS)。智能决策支持系统充分发挥了专家系统以知识推理形式解决定性分析问题的特点,又发挥了决策支持系统以模型计算为核心的解决定量分析问题的特点,充分做到了定性分析和定量分析的有机结合,使得解决问题的能力和范围得到了较大的发展。智能决策支持系统是决策支持系统发展的一个新阶段。
2.决策支持系统的基本架构
决策支持系统包括数据仓库、知识库系统、模型库系统、智能分析系统、智能问答系统、人机交互系统。数据仓库、知识库系统为平台提供资源支持,在此基础上利用智能分析系统、模型库系统对资源进行有针对性的分析,并通过智能问答系统、人机交互系统向用户提供个性化的服务。
(1)数据仓库
数据仓库是决策支持系统的一个最基本的部件。一般情况下,任何一个决策支持系统都不能缺少数据仓库及其管理系统。数据仓库是面向主题的、集成的、稳定的、时变的、用以支持组织决策分析的数据集合。可将来自各数据仓库的信息进行集成,从事物的历史和发展的角度来组织和存储数据,供用户进行数据分析,辅助用户决策支持,为决策者提供有用的决策支持信息与知识。决策支持系统的数据仓库的主要目的是决策支持,因此它对综合性数据或者经过预处理后的数据比较重视。数据仓库将大量用于事物处理的传统数据库数据进行清理、抽取和转换,并按决策主体的需要进行重新组织,这种高度集中的数据为各种不同决策需求提供了有用的分析基础。
(2)知识库系统
知识库是组织和存储知识的基本形式。它是一种结构化的知识集合,包括与领域相关的理论知识、事实数据、专家启发式知识、如某领域内有关的定义、定理和运算法则以及常识性知识等。知识库是使决策支持系统具备智能性的必要条件之一。以知识库为核心实现知识的存储、组织、管理和使用的机制称为知识库系统。从使用知识的角度来看,知识库系统由知识和知识处理机制组成。知识库除了包含事实、规则和概念等知识之外,还包含推进、归纳、演绎等知识处理与管理的方法。
具体地讲,开发知识库时应该考虑如下问题:为自然语言理解创立语义和语用环境;为建模和数值计算提供必要的分析基础;补充和拓展决策人员的思维能力。开发知识库的关键技术是:知识的获取和解释、知识的表达、知识推理以及知识库的管理和维护。决策支持系统特别重视推理和计算的结合,以及机器推理对于决策者思维的拓展能力。因此,决策支持系统的系统框架中,知识库的推理机制至关重要。
知识获取:知识库可用多种方法从多种信息源获取知识,如通过与专家会谈、观察专家的问题求解过程、利用智能编辑系统、应用机器学习中的归纳程序、使用文本理解系统等方式,获取人类专家的知识或将其转换成所需要的形式,也可以从经验数据、实例、出版物、数据库以及网络信息资源中获取各种知识。一般来说,按照知识获取的自动化程度,可以将知识获取划分为非自动知识获取和自动知识获取两类基本方式。
知识表示:知识表示是知识的符号化和形式化的过程,它是知识库系统研究的关键技术之一,也是实现知识存储和建立知识库的前提。知识表示策略决定了推理、决策正确性和有效性,知识表示技术是决策支持系统乃至人工智能的重要研究内容之一。知识表示的目的就是为了让计算机利用这些知识进行推理,合理的知识表示方法有利于问题的求解,提高求解效率。主要的知识表示方法有:产生式表示法、谓词逻辑表示法、语义网表示法、框架表示法、脚本表示法、过程表示法、面向对象表示法、状态空间表示法和问题归约法等。
知识推理:知识推理是知识库系统中不可缺少的模块。目前常用的推理方法有:规则推理、案例推理和人工神经网络等。推理的方式与知识表达之间有着很密切的关系。案例推理通过类比推理方式,参考过去的经验,再结合当前问题的实际情况进行比较,从而找到解决问题的方法。在处理问题时,先在案例库中搜索与当前待求解的新问题具有最大相似度的历史案例,通过两者属性之间的比较对历史案例复用推理出当前问题的求解方案。
(3)模型库系统
模型库是决策支持系统的共享资源,它有一些具有支持不同层次的决策活动的基本模型,其中有一些为支持频繁操作的单一模型;还有一些用于生成新模型的基本模块和基本要素。这样模型库就是一个“产生”模型的基地,而不是预先建立的模型集合,通过模块组合,可以使模型更加灵活的变更,解决软科学所涉及的问题时,可利用的模型已达到100多个,但根据它们的功能和用途可分为若干模型群体,即模型群。具体的模型群有以下几种:预测模型群、系统结构模型群、数量经济模型群、优化模型群、不确定模型群、决策模型群、系统综合模型群等。
(4)智能分析系统
智能分析系统是基于各类型知识库、方法库、模型库,依托于决策支持系统底层的数据仓库,为决策者提供各种形式的资源分析途径和工具,包括对文本型和结构化数据的挖掘和分析;对若干主题的网络信息进行监控,自动生成监测报告,建立对一些重点领域问题的预警机制、检索子系统、数据挖掘分析子系统、数据联机分析子系统、实体名称抽取子系统。
(5)智能问答系统
智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低系统运行成本。在决策支持系统中,基于各类信息资源,整理为规范的问答库形式,以支撑各种形式问题的智能问答。该子系统是知识获取的具体应用形式,目的是使平台各个不同层面的用户能快捷地获取自己感兴趣的知识。
(6)人机交互系统
人机交互(Human-Computer Interaction)是电子信息科学和认知心理学两大学科相结合的产物,它的研发涉及人工智能、自然语言处理、多媒体系统等技术,同时也是吸收了语言学、人机工程学和社会学的研究成果。在决策支持系统中,人机交互是以信息技术作为用户界面的技术基础,通过信息系统的建模、形式化描述、整合算法、评估方法以及软件框架等信息技术最终实现和应用的过程。认知心理学作为人机交互研究的理论基础之一,经常用来指导人机交互模型的分析、建立和评估。一个好的模型能通过用户易于理解的形式描述交互的目标、功能、使用方法和界面,提高交互系统的使用效率和可用性。
(二)临床决策支持系统
临床决策支持系统现在已经成为了临床信息系统的一个重要组成部分。该系统可以为临床医生提供大量的医学支持,从而帮助临床医生做出最合理的诊断策略,选择最佳治疗措施。
1.CDSS的概念
临床决策支持系统(Clinical Decision Support System,简称CDSS)是通过计算机为临床医生的决策提供辅助的工具。CDSS是运用专家系统的设计原理与方法,模拟医学专家诊断、治疗疾病的思维过程编制的计算机程序,它可以帮助医生解决复杂的医学问题,作为医生诊断、治疗以及预防的辅助工具,同时也有助于医学专家宝贵理论和丰富临床经验的保存、整理和传播。
2. CDSS的意义及作用
CDSS用途广泛,可以通过报警机制减少医疗事故和药物错误,提高病人的安全性;当病例复杂、罕见或者诊断者缺乏经验,可以根据病人的数据帮助提供可能的诊断;可以寻找现有治疗计划的矛盾、错误和缺陷,也可以根据病人的特殊情况和已有的治疗方针制定新的治疗计划。大量研究表明,CDSS的应用可以有效解决临床医生知识的局限性、减少人为疏忽(特别是药物定量方面)、相对降低医疗费用等,从而为医疗质量提供了保证。根据2005年发表于JAMA的比较权威的系统性回顾,说明大多数国外报道的临床决策支持系统对医生的工作质量有提高作用。一篇发表于JAMIA的文章公布了哈佛大学医学院附属布里格姆妇女医院十多年来使用带有决策支持功能的电子处方系统的一组经济数字,说明设计良好的临床决策支持系统是可以为医院带来经济上的利益的。
3.临床决策支持系统的发展及其应用
根据应用领域的不同,CDSS可以划分为大规模型系统与高度集中型系统两类。大规模型系统覆盖了医学多个专业领域的问题,目前这类系统较少。高度集中型系统主要针对具体医学专业领域的某种疾病(比如妊娠糖尿病)或某类疾病进行辅助诊断,这类系统较多,如Anderson等报道的产前决策体系;英国普利茅斯医学院研究生院妇产科Keith等开发的智能胎心率与宫缩描记图(cardiotocography,CTG)决策支持系统;土耳其Hacettepe大学妇产科Besac等开发的利用超声测量胎头有关数据估计胎龄的智能专家系统。与集中型CDSS相比较,开发大规模型CDSS相对困难,并且维护复杂、费用高。这也是一些大规模系统在开发后并没有得到广泛应用的原因。表10-3-1列出了5种大规模的系统,这些系统在临床上已得到了较长时间的应用,同时对开发大规模CDSS具有重要影响。
表10-3-1 大规模临床决策支持系统实际案例

 

系统
描述
知识和推理部件
DxPLain
5000种症状,2000种疾病,WWW用户界面,麻省总医院
非贝叶斯算法(专家规则)+半定量的权值来表达数据(信息和症状)之间的概率联系
Iliad
1200种疾病,数字字典包括1500种综合病症、治疗方案以及11900个数据,盐湖城犹他州大学
贝叶斯算法
QMR
700种疾病,匹兹堡大学
基于规则的系统
HELP
决策支持组件的医院信息系统,盐湖城犹他州大学
基于规则的系统,Arden算法(一种行为规则的标准语言)
EON/RPOTEGE
定义了可升级的新型结构(仅处于试验性的应用),EON包括一系列可以与大规模的医疗信息系统相融合的软件组件,斯坦福大学
 
基于规则的系统,本体与问题解决方法相分离

 

(来源:赵春伟,严壮志,孙允高. 产科决策支持系统的设计构思[J]. 北京生物医学工程,2006,25(1):85-88)
世界上第一个功能较全面、也是最具代表性的CDSS实例之一是1976年美国斯坦福大学肖特列夫(Shortliffe)开发的MYCIN系统,这个系统是用来帮助临床医生判断菌血症和脑膜炎的病原菌以及选择合理的抗菌药物的决策支持系统。MYCIN系统建立了一整套开发CDSS的理论,它的成功研制对CDSS的应用和技术发展都产生了深远的影响,可以说,MYCIN是CDSS发展史上的一个里程碑。1982年美国匹兹堡大学的Miller等开发了INTERNIST-l系统,该系统包括600多种内科疾病的诊断知识,具有非常庞大的知识库。经过20多年的努力,它成为国际上规模最大、水平最高的CDSS之一。1991年哈佛医学院开发的“DXPLAIN”系统包含了2200种疾病和5000多种症状。CDSS的规模有大有小,除了多疾病大型专家系统外,针对某一种疾病的专项医学专家系统更是举不胜数。1990年,Umbaugh开发了皮肤癌辅助诊断系统,Provan等人研制了用于诊断慢性腹痛的决策支持系统。1996年Birndorf等人开发了贫血诊断报告系统。2000年Wells等人开发了计算机辅助乳腺治疗计划系统。
在我国,1975-1979年,北京中医医院与中国科学院自动化研究所、北京第二医学院合作研究编制出中医关幼波教授对肝炎的辨证论治诊疗经验的电子计算机程序,是我国最早基于中医理论的临床决策支持系统。上个世纪80年代以来国内涌现了一批专科临床决策支持系统,如肝病营养疗法专家系统、昏迷诊断计算机专家系统、急性肾衰诊断系统、颈腰疾病专家系统、精神疾病诊断系统、甲亢诊断系统、贫血鉴别系统、肺癌诊断系统、心功能辅助诊断系统、针灸专家系统及医病诊疗用药系统。2003年易涛等人研制的“心血管药物治疗专家系统”,采用了案例推理方式,解决临床医生获得用药经验和知识的问题。它根据对病人病情的描述,按照一定的案例检索机制,从以往的病例库中查找一个与该病人病情相匹配的既往病例。如果该病例与当前病人病情的各项特征完全相符,则将该病例的治疗方法直接提供给医生参考;否则,根据两者的不同之处,先对既往病例进行修改或注明不同之处,再将其提供给医生参考。进入21世纪以来,临床决策支持系统在临床用药、产科、心脏病、神经外科等领域得以广泛研究和应用。
尽管CDSS有很多优点,但目前真正能为医生所接受并投入实际临床使用的大规模CDSS为数不多。造成大规模型CDSS没有长时间广泛应用的原因很多,主要有:第一,部分CDSS的开发者缺少对临床的了解,因此开发的CDSS不能满足医生的需求。第二,知识获取和表示的问题。人体是个复杂的系统,通过简单的模型进行知识表达,往往造成系统过于简单化、机械化。第三,决策支持系统开发的技术问题。很多问题表面看来有完善的解决办法,但一用到错综复杂的现实中便失灵。比如推理模型,绝大多数临床决策支持系统推理策略都基于流程图、概率论或认知模型。基于流程图的方法可以很好解决简单问题,但问题稍复杂就使流程图变得难以处理。这些都是今后临床决策支持系统理论与实践研究中需要解决的关键问题。
(三)卫生决策支持系统
1.卫生决策支持系统的概念
卫生决策支持系统以国家医疗卫生事业发展目标为导向,以互联网搜索技术、信息智能处理技术和自然语言处理技术为基础,构建卫生领域相关知识库、模型库和方法库,建设并不断完善有权威性的决策支持平台,为国家医疗卫生事业的发展和医学科技创新提供全方位、多层次的决策支持和知识服务。
2.卫生决策支持系统的意义
由于特定的历史条件、国情,以及定量分析在数据与方法方面的制约,目前卫生决策制定仍以定性研究和经验决策为主,受限于个体对相关领域了解的广度、深度和实时程度,基于直觉和有限知识范围的评估、预测与决策缺少有力度的佐证,缺少数据和知识的支持,存在一定程度的随机性和不稳定性,影响了制定医药卫生战略规划与卫生政策、确立医学科研项目、管理医学科技资源的科学程度。为解决严重影响人民健康的重大问题,提高决策科学化、管理科学化水平,迫切需要建立一套科学、高效的决策支持体系。卫生决策支持系统的建立,将提供更加科学、定量的政策分析模式,有效解决制定战略决策及发展规划中的复杂问题,实现对既定政策的量化指标评估及效果预测,提高决策科学化水平。
3.卫生决策支持系统的应用
目前针对卫生领域开展的决策支持系统的建设较少,典型案例包括:
(1)军队卫生信息资源配置决策支持系统
为了提高军队医院的持续发展能力,军队卫生信息资源配置决策支持系统依据军队卫生信息资源配置理论,采用系统性思考与实践的方法论,界定了军队医疗资源优化配置的逻辑模型。该系统综合考虑其系统结构的科学性、管理制度的合理性及与之相适应的外部环境三个影响因素,针对医疗资源配置微观决策行为的动态过程,确定军队医院医疗资源的适度规模,结合用户的实践经验合理干预资源利用效率,最终确定各类外生性要素资源的结构比例,提高军队医疗资源配置的技术效率,实现军队医院的内生性增长。
(2)非典防治决策支持系统
非典防治决策支持系统采用地理信息系统技术,通过电子地图进行实时动态数据的显示,并对各类专题信息根据时间段、地域范围等条件进行查询。该系统包括信息数据采集与报送模块、信息数据与系统管理模块、可视化决策分析模块、信息发布与指挥模块4个部分,同时整合了健康随访动态制图、医疗救治动态制图、入城检查动态制图等特殊功能,强化了系统的决策支持能力,在非典防治过程中发挥重要作用。
(3)卫生检验检疫决策支持系统
卫生检验检疫决策支持系统主要是利用数据仓库技术,为国家质检总局和直属检验检疫局、分支局甚至办事处的不同业务部门建立统一的决策分析平台。该系统的数据来源主要来自检验检疫业务系统、外部信息以及历史数据等数据源,将分散在不同数据源的数据进行抽取、清洗、转换等,将整合后的数据装载到数据仓库中。数据访问模块在数据存储模块的基础上,进行统计报表、OLAP分析、数据挖掘和商业管理,并将结果通过WEBGUI方式表示。
(4)中国公众健康网
中国公众健康网由中国医学科学院医学信息研究所研发,主要面向社会大众,及时发布重要疫情的预防、治疗等相关知识,缓解社会普遍存在的寻医问药难的问题。根据公众对医疗信息的需求特点,着眼于国家规划、百姓健康、前沿科学三个层面,采集相关知识源,按照成熟的元数据标准,整合各类信息,提供疾病预防、健康保健、求医问药、医疗法规等信息的查询、学习和在线咨询服务。该系统的目标是通过医疗信息服务的普及和深入,提高公众健康信息素养以及获取和利用健康知识的能力,从而全面提高公众健康和医疗卫生水平。
(5)卫生政策研究知识服务平台
卫生政策研究知识服务平台由中国医学科学院医学信息研究所研发,主要面向卫生决策人员和卫生政策研究人员,整合卫生政策研究信息资源,实现准确的知识分类、知识的快速定位和获取,实现用户分层管理,构建能充分满足卫生政策管理人员和卫生政策研究人员需求的决策支持系统。该系统以专业化的信息资源为核心,根据卫生政策研究的特点,以辅助卫生决策为目标,从多渠道获取专业学术资源和能够充分反应公众对各项卫生政策以及突发公共卫生事件的舆情舆论信息,采用数据清洗工具,对结构化、非结构化以及半结构化的数据进行处理,保存至数据仓库中,利用知识组织工具、智能分析工具以及可视化工具挖掘实体之间的关联,为卫生决策人员和卫生政策研究人员提供科学的参考依据。
进入21世纪,移动通信技术取得了突飞猛进的发展,特别是与有线互联网结合而成的移动互联网使得移动信息服务成为21世纪的一大潮流。手持无线设备作为报纸(杂志)、电视、广播、互联网之后的第五媒体,逐渐融入人们的生活。通过手持无线设备不仅可以通话,还可以上网、阅读新闻、收发E-Mail、游戏娱乐、炒股、订购商品、甚至听广播、看电视等。随着无线应用技术的发展,图书馆亟需寻求一种适合的技术来构建图书馆的移动服务,使图书馆的信息环境能够超越地理空间的限制。利用手机移动通信平台延伸的图书馆服务,将为图书馆事业的创新发展提供契机。
目前,常见的用于移动信息服务且较为成熟的无线接入方式包括短消息(Short Message Service,简称SMS)、无线应用协议(Wireless Application Protocol,简称WAP)、互动语音应答(Interactive Voice Response,简称IVR)等,根据软硬件环境各有不同应用。但是相比较而言,WAP以其多媒体服务特性更受青睐,尤其发展到WAP2.0,其在数据同步、多媒体信息服务、统一存储接口等方面表现更为出色。
WAP是由Motorola、Nokia、Ericsson几家公司和美国的软件公司Phone.com最早倡导和开发的无线应用协议,是使移动通信设备接人互联网的开放的国际标准,是一种窄带宽传输数据的通信协议。通过WAP技术,可以将Internet的大量信息及各种各样的业务引入到移动终端中。在传输网络上,WAP不仅支持目前的各种移动网络,如GSM、CDMA、PHS等等,还可以支持第三代移动通信系统。可以说,WAP是目前移动信息服务平台的最佳选择,这种接人方式能够与传统的网络信息服务保持高度的一致性。但随着通信技术的发展以及无线宽带的普及,速度更快、信号更稳定、价格更低廉的无线网络将为移动信息产业开创新的领域。
目前大部分手机都支持WAP功能,但由于手机品牌、型号和操作系统的不同,其使用方法和操作也不尽相同,目前主要的手机操作系统有Symbian系统(诺基亚)、Windows系统(多普达)、MAC OS(IPHONE)、Android平台(Gphone)等。虽然各系统有所差异,都直接或间接实现文本、PDF文件、Microsoft office文件等阅读浏览。
国家图书馆等国内一些大型纷纷开通WAP OPAC等服务。国家图书馆本着“以人为本”的人文关怀服务精神,适时地将移动领域的先进技术引入图书馆服务中,推出以手机为媒介的国家图书馆移动服务-掌上国图。掌上国图为您提供随时的、随身的图书馆。通过掌上国图,读者可以随时、随地、随身地了解国家图书馆、使用其资源。该服务包括移动数字图书馆、短信服务、国家图书馆WAP网站、手机阅读和国图漫游五部分。
其中,移动数图是以智能手机为载体,采用先进的移动快讯技术,将传统短信的推送服务方式和WAP网站的拉取服务方式相结合,为读者提供便捷、及时、个性化的新型服务。读者在自己的手机上安装国家图书馆提供的客户端软件,即可根据个人喜好订阅信息频道。结合手机的特点,对国家图书馆拥有的数字资源进行分析,最终确定了七个频道,包括国图动态、文化快递、书刊推荐、资源欣赏、书海拾珍、资源检索、读者服务。
可通过短信服务实现预约到达通知、图书催还、图书续借、读者卡挂失、读者卡过期提醒、读者意见与建议等服务。
国图漫游服务包括读者指南、静态导航、动态导航和模拟国图四部分。其中,读者指南使读者可以通过手机简单快捷地获取国家图书馆及其阅览室、借阅处、服务处的基本信息。静态导航为读者提供了国图主楼和各楼层的平面图,读者可以从宏观上了解自己所处的位置和各阅览室的位置;动态导航部分则根据读者选定的初始点和终止点,仿真地为读者指示路径,自动带领读者到达目的地;模拟国图提供国图场景,读者可以身临其境般地漫游其中。
手机阅读服务是国家图书馆推出的,针对手机用户进行订阅、下载、导入和阅读各种图书、报刊、杂志、漫画等内容的崭新服务形式。
手机阅读服务是基于智能手机终端的服务,目前资源总量达到一千余种图书和20余种报纸。读者在手机中安装手机阅读服务终端后即可按照个人兴趣订阅报纸和下载图书。在阅读过程中可以进行页面跳转、书签设定等,使阅读更加随心所欲。
图10-5-1手机阅读服务
移动医疗(Mobile Health,简称mHealth),通过移动通信技术来提供医疗相关的服务,是一种有效、快捷的医疗卫生服务。在医疗人力资源短缺、时间紧急的突发情况下,可以使患者能够及时得到必要的救护与诊治。
mHealth和eHealth是紧密相连的,都是致力于改善医疗服务,并且其技术也紧密联系。许多eHealth的项目,如电子化病人病历,都需要标准化病人数据。而mHealth项目则可以作为访问病人数据的访问点,或者作为远程工具为小诊所、家庭医生或者其他医疗工作者提供信息。同时,还有其他独立的mHealth项目。
移动医疗的范围非常宽,并且各种应用都还在持续不断地发展。目前,发展中国家在mHealth领域的关键应用主要有:教育与通知、远程数据采集、远程监控、针对医疗工作者的交流与培训、疾病与流行病传播跟踪及诊断与治疗支持。
1. 教育与通知
作为低成本的通信方法,短信服务(SMS)已经成为了一种为各种医疗问题提供可达服务的有效方法。在这一方向的应用中,SMS消息直接发送到用户手机上,提供测试与治疗方法、医疗服务和疾病管理等方面的信息。不管是正式的研究还是人们的使用感受,都认为SMS比起收音机和电视具有更好的作用。
SMS同时还具有不引人注意的特点,这对保护病人隐私具有很好的作用。在发展中国家,SMS对于那些偏远地区,缺乏医院、缺少医疗工作者、对医疗相关信息了解较少的人们而言,尤其有效。另外,SMS不仅可以作为单向的通知工具,还能够成为双向的交流工具。
2.远程数据采集
各级政府与医疗机构都需要准确的数据来调整相关政策与措施。在发展中国家,采集信息更加重要,因为其中很多人都很少去医院,即使是身患严重的疾病。在病人生活的地方进行数据采集是很有必要的,并且应该保持这些信息及时更新。通过智能手机、PDA或者移动电话,而不是手动填写和录入的纸面调查,可以让数据采集工作更加有效和可靠。
3. 远程监控
对病人实行远程监控是最适合与移动通信技术相结合的应用之一,这使得在发展中国家普遍存在的因医疗资源匮乏导致的非住院治疗有了更好的保证。这种应用可以是单向或双向的,用于监控医疗条件、维护医疗服务预约、保证药物持续调整等,有的还包括对住院病人和非住院病人传感器数据的远程监控。
4. 针对医疗工作者的交流与培训
缺少医疗工作者是发展中国家在医疗卫生领域所面临的最主要问题。培训新的从业人员及加强现有工作者的能力,从而提升工作质量是至关重要的。医疗工作者通过移动通信技术访问各种信息资源,是强化其工作能力的一种有效方法,同时,也是加强不同医疗机构间交流并提供更有效医疗服务的紧迫要求。
5. 疾病与流行病传播跟踪
传染病通常是在小范围内爆发,但如果不能及时发现,则可能会发展为流行病。这样的例子,从霍乱到结核病,从非典型性肺炎到甲型流感,简直是不胜枚举。随着移动设备的普及,这样的疾病信息能够快速得以反馈,这对预防和控制传染病的传播至关重要。目前,很多发展中国家已经建立了基于移动通信技术的疾病报告机制,这比之前使用的手写、卫星和无线电通信要有效和及时得多,并且能够提升报告数据的质量和可靠性,降低运行成本。
6. 诊断与治疗支持
诊断与治疗支持对于医疗极其重要,因为误诊或者无法确诊可能会导致严重、甚至是致命的后果。mHealth在这一领域的应用主要是让远程的医疗工作者通过无线网络访问医疗信息数据库或者与其他医疗工作者沟通,获取有效的诊断和治疗建议。有了基于mHealth的诊断和治疗支持,病人能够在本地接受高质量的治疗,而无需费时费力地去那些对于大多数人而言无法负担的医疗条件更好的医院进行治疗。这一应用通常要求医疗工作者的手机安装特别的工具,例如内置的软件,以便引导其一步步地进行诊断。一旦这些数据进入了系统,异地的医疗工作者就可以进行疾病诊断,并进行治疗指导。
随着无线技术的不断成熟和普及,无线网络的应用在全球范围内医疗行业中已经成为一种趋势,国内越来越多的医院开始了“随时随地”移动医疗的探索。
(钱庆,安新颖,张玢,方安,侯丽,王敏,孙海霞,李越)
思考题
1. 什么是数字出版?与传统出版相比,数字出版有哪些优势?
2. 什么是开放获取?对其所面临的挑战,您是如何看待的?
3. 国内外图书馆web2.0技术的应用模式主要包括哪些方面?
4. 图书馆2.0的兴起对于信息资源的检索和利用具有哪些影响?
5. 什么是知识检索,有哪些知识检索的案例?
6. 什么是信息可视化,信息可视化的类型有哪些?
7. 医学信息决策有哪些特性?医学信息决策有哪些分类?
8. 什么是临床决策支持系统?请列举出一至二个典型的临床决策支持系统。
9. 移动医疗技术可实现哪些功能?
10. 结合临床实践工作,畅想移动技术还能为医疗工作提供哪些功能?


 

 

摘自《医学信息检索与利用》
主 编 代 涛
副主编 许培扬 阮学平
编 者 (按姓氏汉语拼音字母顺序排列)
       阿丽塔 安新颖 代 涛 方 安 葛红梅 
      侯 丽 黄利辉 李军莲 李 越 刘晓婷 
       倪素云 钱 庆 任慧玲 阮学平 孙海霞 
       唐小利 王 敏 许培扬 张 玢 张燕舞 
       周 琴  
秘 书 张 玢  


https://blog.sciencenet.cn/blog-280034-389540.html

上一篇:中国医生更加关注每日临床证据(循证医学)信息
下一篇:Science Blog (科学博客)受到更多科学人的关注
收藏 IP: .*| 热度|

1 郭桅

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 09:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部