tony8310的个人博客分享 http://blog.sciencenet.cn/u/tony8310

博文

科学文库书籍的阅读与保存

已有 9384 次阅读 2022-1-4 08:59 |系统分类:科研笔记

目的:2020年在科学出版社的科学文库下载了一些专业书籍,当时用cajviewer可以打开,但有15天的期限。最近打不开,可能是pdf加密了,修改计算机时间无效,可能文件要与服务器校对时间。

先说结论,建议两种方案:

(1)离线保存网页,在看文件时需要联网;

(2)将文件打印成pdf,文件比较大。
具体的说明如下:

思路:(1)直接下载pdf;

(2)离线保存网页;

(3)将文件打印成pdf。
尝试:

(1)直接下载pdf不可行。文件经过webpdf.js处理后,Pdf的一页被支解成6张png.


(2)离线保存网页,在看文件时需要联网。在超理论坛中“科学出版社图书全文下载方法”中提到,ctr+S将网页保存,可以查看所有的页面。经分析,文件仍是经过webpdf.js处理过。联网方便的,可以考虑这种方法。


(3)将文件打印成pdf,文件比较大。这种方法在知乎的“网页预览pdf文件怎么下载?”中有提到。科学文库的书箱可以在线阅读30页,但打印只能打当前页面。经分析,可以将打印对话框中的设置修改,可以打印100页。但是,这样打印的仍是图片,文件是原来下载的pdf的10倍左右。
此外,还可以用截图,打印成Pdf。但是,图片质量不太好,操作麻烦。可以参考“一招教你下载那些:只能在线阅读的PDF - 知乎"

-------------------------------

下载后的pdf加书签

1 在科学文库书箱介绍网页,F12 复制content中的 ul id =treeDemo。...inner html内容,到用Notepad++ 中。
2 在Notepad++ 中 ctr +F, 标记 搜索pagenum=(.*?)"|title="(.*?)",复制标记文本,进行文字清理,在Excel中两列合并。
3 用pdfpatcher pdf补丁丁,导入书签文件,进行后面的书签分级等。



https://blog.sciencenet.cn/blog-331295-1319484.html

上一篇:日程记录-日历软件使用
下一篇:年度总结与安排
收藏 IP: 111.33.236.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-28 15:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部