||
F:scifinder_czq>java -jar selenium-server-standalone-2.48.2.jar -firefoxProfileTempla
te C:UserschenzqAppDataRoamingMozillaFirefoxProfilesy9ndojbu.selenium
开启自定义的firefox。 还有一种写法不需要写路径,但是关键词忘记了。
自定义firefox的好处,就是selenium 你可以设置点击链接直接下载不需要询问你是否下载。
从而实现自动化。在about:config中可以设置点击直接下载。
记得留时间让页面加载完成。我测试的时候用的是160000s.这个是load的最大时间
同时必须要pause一段时间。我测试的时候用的是10s. 这个是实际pause的时间。
另外selenium最新版本的firefox,会误认为是chrome。 所以不要点帮助中的更新。
-----------------------------------------
不管是perl还是python接口都是一样的。
有了这个工具,就可以跳过js的分析,实现自动下载了。
有些链接,click了以后会出现一个新窗口,
目前用的方法是,获取click的链接,改用open操作。
-------------------------------------------
一个简单的测试脚本,从bioms中下载文件。
----------------------------------------------
selenium 可以和phomjs联用,这样说不定可以能更快的分析JS的入口。
这样通过自动化,就能通过internet自动获取大数据。
直接下载 ,关闭询问窗口
#fp.set_preference('browser.download.folderList', 2)
#fp.set_preference('browser.download.manager.showWhenStarting', False)
#fp.set_preference('browser.download.dir', os.getcwd())
#fp.set_preference('browser.helperApps.neverAsk.saveToDisk', 'text/plain, application/vnd.ms-excel, text/csv, text/comma-separated-values, application/octet-stream, application/vnd.openxmlformats-officedocument.spreadsheetml.sheet')
#firefoxProfile = webdriver.FirefoxProfile()
#firefoxProfile.set_preference('browser.download.folderList', 2)
#firefoxProfile.set_preference('browser.download.manager.showWhenStarting', False)
#firefoxProfile.set_preference('browser.download.dir', '/media/pinku/Pinku')
#firefoxProfile.set_preference('browser.helperApps.alwaysAsk.force', False)
#firefoxProfile.set_preference('browser.helperApps.neverAsk.saveToDisk','application/octet-stream')
-------------profile 详解-----
profile.setPreference("browser.download.folderList", 2); //browser.download.folderList 设置Firefox的默认 下载 文件夹。0是桌面;1是“我的下载”;2是自定义
https://support.mozilla.org/zh-CN/questions/1067923
http://www.cnblogs.com/shpchan/archive/2010/01/14/1647596.html
判断元素是否存在
https://github.com/gempesaw/Selenium-Remote-Driver/issues/96
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-23 01:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社