|||
数据采集小作业-(18)基于R对东营酒店信息的采集
作者:曹智苗
指导教师:王文武
单位:曲阜师范大学 统计学院
随着科技的发展和进步,计算机行业在国内外迅速崛起,大数据时代悄然而至。生活中处处都有信息的存在,计算机的普及及发展使之成为海量信息储存的载体。生活在信息时代,我们应该学会获取以及利用我们身边的信息来解决生活中的一些问题。合理利用我们身边的数据,让数据方便我们的生活。本文基于R语言适用rvest包与stringr包对东营酒店的信息进行爬取。运用rvest包读取了携程网上有关东营酒店的网页并爬取了相关数据,但是由于爬取下来的数据杂乱的,并且含有大量冗余信息,所以我们运用stringr包对数据进行了清洗。最终生成部分酒店信息的excell表格。接下来,我们又对所爬取数据进行了分析。
具体研究见附件。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 07:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社