rasin的个人博客分享 http://blog.sciencenet.cn/u/rasin 药物设计 化学信息学 分子模拟

博文

利用NTFS新特性管理参考文献

已有 4088 次阅读 2014-5-29 22:18 |系统分类:科研笔记| 标签, 管理, 参考文献, 搜索, 关键词

     传统的操作系统均采用目录的方式对文件进行管理,当文件数量比较少的时候还比较合适,但是当文件比较多,关系比较复杂的时候,传统的目录方式就不太好用了。比如一首歌曲,可能同时需要在“郑智化”和“忧伤”两个目录里存放;在科研中我们可能有很多这样的参考文献,既属于“基于配基的药物设计”又属于“数据库”类别。

     这个时候如果单纯复制文件到两个目录中,会增加磁盘占用,而且对文件的修改和注释很难同步;如果用快捷方式,则常常会因为原始文件改名或者目录变动而失效。


     如果操作系统能够支持给文件添加标签或者关键词,当我们需要找一个文件的时候,可以用关键词查询,就会方便的多。试想,如果可以象在Everything中一样快速地找到所有在磁盘中关于某一主题的文献或者某一歌星的歌曲是多么爽啊。不知道这样一个不算过分的需求,微软为什么一直没有实现。


     为了解决这一问题,我尝试了多种对文件进行标签管理的软件,比如TabblesTaggedFrogTaggtoolsTag2Find等等,均不好用,不是系统稳定性和可操作性差,就是不具备可移动性。更早的时候,我还尝试了PDF Explorer和PDF ShellTools两个工具,pdf相关的功能不错,(我甚至翻译了这两个软件的手册),但是,依然存在界面差、win7不兼容等缺点。


    通过测试、对比,我发现有两种方式是最好的解决方案:

方案1:
其实Unix操作系统早就预留了答案,即 对软链接和硬链接的支持。所谓硬链接就是一个文件数据块有两个或多个文件分配表的条目来对应,当删除其中一个文件的时候,其实只是删除了目录中的文件名,文件的数据内容没有变化。硬链接支持同一文件系统内创建。软连接,也称符号链接,是对一个文件的间接指针,类似于快捷方式,但是属于文件系统和操作系统底层的东西,比如对目录的软链接,其属性仍为目录。而快捷方式只是一种应用层次的文件类型,其本质是文件。如果源文件发生变动,软链接虽然也会失效(ls时会以红色标出)。

在NTFS 5.0之后,windows系统也支持建立硬链接和对目录的junction,只不过需要用命令行方式建立。其实,可以采用一个叫link shell extension的软件实现图形化操作,网址如下,http://schinagl.priv.at/nt/hardlinkshellext/hardlinkshellext.html
网页上的操作手册介绍得很复杂,这主要是因为对文件和目录的复制、移动会有很多方式。平常使用中,如果只简单建立硬链接和junction的话,是很简单方便的。网上也有很多对NTFS链接工具的介绍。



方案2:NTFS支持文件的流文件和元信息,所谓流文件,就是依附于可见文件的文件,是彻底隐藏的,我们一般用不到。所谓元信息,就是一些对文件的简短描述。比如文件的作者是谁,关键词是什么等等,这些信息不是存储到文件中,而是存储到文件系统里。由于微软的支持,word文件中的元信息和操作系统中是相同的。在win7下选中一个word文档时,可以再详细信息浏览区修改这个文件的相关信息。作为参考文献的主要格式,PDF文件就没有这么幸运了。选中pdf文件时,没有作者、备注信息可供修改。这时可以安装PDF Xchange、Adobe iFilter或者File MetaData(支持所有文件类型),就可以方便地修改了。修改后的文件备注信息,可以再windows资源管理器的搜索框里搜索到,当然先建立索引可以提高速度。


我用的是File Metadata (file meta association manager,URL 见本文最后),设置完成后,效果如下图,可以一次修改多个文件,支持搜索。


为了寻找合适的文献管理方式,我花了挺多时间,希望以上文字对在这方面有困惑的人能有所帮助。


回头一看,居然也码了这么多字。表达能力有限,不知道有没有说清楚,不清楚的地方就问万能的GOOGLE吧。高考语文不及格的人伤不起啊!!!




PS:

上面第一种方案比较容易实施,有朋友问第二种方案的方法。其实比较简单,安装完PDF iFilter以后(Foxit, PDF Xchange, Adobe的均可),参照以下论文(知网可下载)设置索引选项后即可使用。

在应用文件属性出错时,可能需要重启资源管理器。


File association Manager则安装之后按下图设置即可



几个参考链接:

http://blog.techhit.com/55696-indexing-and-searching-pdf-content-using-windows-search

https://forums.adobe.com/thread/482326

http://www.cnki.com.cn/Article/CJFDTotal-DNAH201121050.htm

 

FileMeta的下载地址(有个别同学没有搜到):

http://filemeta.codeplex.com/



https://blog.sciencenet.cn/blog-460432-798785.html

上一篇:科普啊,民科啊
下一篇:国家自然科学基金预算管理表格
收藏 IP: 220.249.99.*| 热度|

1 htli

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 04:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部