wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

基于R对东营酒店信息的采集

已有 1933 次阅读 2019-5-15 17:39 |个人分类:研究生课程论文|系统分类:科普集锦| 自动数据采集

数据采集小作业-(18)基于R对东营酒店信息的采集

作者:曹智苗

指导教师:王文武

单位:曲阜师范大学  统计学院


       随着科技的发展和进步,计算机行业在国内外迅速崛起,大数据时代悄然而至。生活中处处都有信息的存在,计算机的普及及发展使之成为海量信息储存的载体。生活在信息时代,我们应该学会获取以及利用我们身边的信息来解决生活中的一些问题。合理利用我们身边的数据,让数据方便我们的生活。本文基于R语言适用rvest包与stringr包对东营酒店的信息进行爬取。运用rvest包读取了携程网上有关东营酒店的网页并爬取了相关数据,但是由于爬取下来的数据杂乱的,并且含有大量冗余信息,所以我们运用stringr包对数据进行了清洗。最终生成部分酒店信息的excell表格。接下来,我们又对所爬取数据进行了分析。

       具体研究见附件。

曹智苗-基于R对东营酒店信息的采集.pdf




https://blog.sciencenet.cn/blog-3316039-1179214.html

上一篇:全国股票交易数据提取及分析———基于 R
下一篇:[转载]曲阜师范大学 统计学院 招生简介
收藏 IP: 61.179.124.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 02:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部