博文

Python学习笔记——一个简单网络爬虫的编写以及对应模块的学习

已有 3643 次阅读 2015-11-16 08:57 |系统分类:科研笔记

一个简单网络爬虫程序的编写以及对应模块的学习

前几日加班加点的在传课网学完了智普教育的Python入门教程。今天回过头来重新对一些重要的章节进行温习，现在就对While循环的应用实例——一个简单网络爬虫程序的编写进行简要的记录，以备后期温习。

程序内容及详细注释

程序内容

********************************************************************************************************

import webbrowser as web #导入webbrowser模块，将其命名为web，这个模块可以调用系统默认的浏览器程序，打开一个制定的网页

import time #导入time模块，该模块提供各种操作时间的函数

import os #导入os模块，该模块包含普遍的操作系统功能

import random #导入random模块，该模块可以用来生成随机数

j = 0

count = random.randint(1,10) #在1-3之间随机生成一个数，并将这个数赋值给count

while j<=count:

i=0

while i<=10:

web.open_new_tab("http://blog.csdn.net/kiki113/article/details/4033017") #命令默认浏览器工具在打开一个网页

i+=1

times.sleep(1) #网页打开的间隔时间为1秒

else:

os.system("killall chromium-browser") #在上述循环十次之后，关闭浏览器，os.system函数可以让程序执行shell命令（在Linux中）

j=j+1

print "count is %s"% count #显示出循环的次数

********************************************************************************************************

程序描述

该程序可以一次在浏览器中打开10个指定的网页，每打开一个网页的间隔是1秒钟，10个网页完全打开之后，关闭浏览器。然后循环进行上述操作，循环次数最少为1次，最大为10次（1-10之间的随机数）。

模块学习

webbrowser模块

后续更新

参考资料

[1]http://baike.baidu.com/link?url=ls0xmV8VMUuicHbKJ9xGeS6Mvqls2DeNBJsG8cxVi4fKMayJQelaPt3bqkbggtjJ8voawfQjfCmExWErh3J8nq

转载本文请联系原作者获取授权，同时请注明本文来自陈振玺科学网博客。
链接地址：https://blog.sciencenet.cn/blog-1334016-935615.html

上一篇：Python学习笔记——zip函数的使用
下一篇：推荐一个好用的Google Hosts更新地址——老D blog

收藏 IP: 59.50.66.*| 热度|

当前推荐数：1 推荐人：蒋德明

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

陈振玺

扫一扫，分享此博文

ginseachen的个人博客分享 http://blog.sciencenet.cn/u/ginseachen

博文

Python学习笔记——一个简单网络爬虫的编写以及对应模块的学习

当前推荐数：1 推荐人：蒋德明

该博文允许注册用户评论请点击登录评论 (0 个评论)

陈振玺

全部作者的其他最新博文

全部精选博文导读

相关博文

ginseachen的个人博客分享 http://blog.sciencenet.cn/u/ginseachen

博文

Python学习笔记——一个简单网络爬虫的编写以及对应模块的学习

当前推荐数：1 推荐人： 蒋德明

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

陈振玺

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：1 推荐人：蒋德明

该博文允许注册用户评论请点击登录评论 (0 个评论)