wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

从猫眼电影TOP100看数据采集

已有 2889 次阅读 2019-5-15 10:48 |个人分类:研究生课程论文|系统分类:教学心得| 自动数据采集

数据采集小作业-(13)从猫眼电影TOP100看数据采集

作者:付悦

指导教师:王文武

单位:曲阜师范大学  统计学院


随着科技的发展,人们对于数据的兴趣越来越高,数据的分析和处理也逐渐变成了人们研究的重点。在处理数据之前,自动爬取数据是进行数据分析的一个很重要的前提。本文主要基于R软件,以猫眼数据TOP100的电影为依托,通过爬取目录页与详情页的信息,介绍爬取数据的详细过程;并在爬取数据之后,对所爬取的数据进行简单的数据可视化处理以加深对于所爬取数据的理解。最后,本文对整体进行了一个总结与概括,这对于我们理解R语言爬虫有着重要的意义。

具体研究见附件。

付悦-从猫眼电影TOP100看数据采集.pdf




https://blog.sciencenet.cn/blog-3316039-1179123.html

上一篇:Rvest包抓取网络数据 ---用rvest包提取澎湃新闻
下一篇:贵州茅台个股历史交易数据的自动采集与简单分析
收藏 IP: 61.179.124.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 17:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部