ginseachen的个人博客分享 http://blog.sciencenet.cn/u/ginseachen

博文

Python学习笔记——一个简单网络爬虫的编写以及对应模块的学习

已有 3643 次阅读 2015-11-16 08:57 |系统分类:科研笔记

一个简单网络爬虫程序的编写以及对应模块的学习

前几日加班加点的在传课网学完了智普教育的Python入门教程。今天回过头来重新对一些重要的章节进行温习,现在就对While循环的应用实例——一个简单网络爬虫程序的编写进行简要的记录,以备后期温习。

  • 程序内容及详细注释

  • 程序内容

********************************************************************************************************

import webbrowser as web #导入webbrowser模块,将其命名为web,这个模块可以调用系统默认的浏览器程序,打开一个制定的网页

import time #导入time模块,该模块提供各种操作时间的函数

import os #导入os模块,该模块包含普遍的操作系统功能

import random #导入random模块,该模块可以用来生成随机数

j = 0

count = random.randint(1,10) #在1-3之间随机生成一个数,并将这个数赋值给count

while j<=count:

   i=0

   while i<=10:

       web.open_new_tab("http://blog.csdn.net/kiki113/article/details/4033017") #命令默认浏览器工具在打开一个网页

       i+=1

       times.sleep(1) #网页打开的间隔时间为1秒

   else:

       os.system("killall chromium-browser") #在上述循环十次之后,关闭浏览器,os.system函数可以让程序执行shell命令(在Linux中)

   j=j+1

print "count is %s"% count #显示出循环的次数

********************************************************************************************************

  • 程序描述

该程序可以一次在浏览器中打开10个指定的网页,每打开一个网页的间隔是1秒钟,10个网页完全打开之后,关闭浏览器。然后循环进行上述操作,循环次数最少为1次,最大为10次(1-10之间的随机数)。

  • 模块学习

  • webbrowser模块

后续更新

参考资料

[1]http://baike.baidu.com/link?url=ls0xmV8VMUuicHbKJ9xGeS6Mvqls2DeNBJsG8cxVi4fKMayJQelaPt3bqkbggtjJ8voawfQjfCmExWErh3J8nq  





https://blog.sciencenet.cn/blog-1334016-935615.html

上一篇:Python学习笔记——zip函数的使用
下一篇:推荐一个好用的Google Hosts更新地址——老D blog
收藏 IP: 59.50.66.*| 热度|

1 蒋德明

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 03:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部