幸福是奋斗出来的分享 http://blog.sciencenet.cn/u/ahyxwangdong 生态学

博文

三、R语言抓取网页中表格信息(XML包)

已有 3949 次阅读 2018-1-5 09:10 |个人分类:读书心得|系统分类:科研笔记| R语言

> install.packages("XML")

> library(XML)

#确定网页地址,通过网页地址分析网页表格

> url<-"http://hz.house.ifeng.com/detail/2014_10_28/50087618_1.shtml"

> tbls<-readHTMLTable(url)

> sapply(tbls,nrow)

NULL NULL

 93    8

#读取网页url的第一张表

> pop<-readHTMLTable(url,which = 1)

#存储popCSV文档

>write.csv(pop,file="F:/pop.csv")


pop.csv文件:


原网页(http://hz.house.ifeng.com/detail/2014_10_28/50087618_1.shtml)表格:





http://blog.sciencenet.cn/blog-484693-1093193.html

上一篇:二、R语言抓取网页信息(用rvest包)——豆瓣图书TOP250
下一篇:四、R语言抓取网页中信息(rvest包)—读取个人图书馆

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-10-22 20:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部