wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

数据采集方法案例分析-2022

已有 3378 次阅读 2022-9-24 15:01 |个人分类:研究生课程论文|系统分类:教学心得

         2022.03-2022.06曲阜师范大学统计与数据科学学院王文武博士主持讨论《基于R语言的自动数据收集---Web数据抓取和文本挖掘》(Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining)。参加讨论的硕士研究生有26名,他们分别是:冯晓平、韩雪、郝雨娟、李航、李梦媛、李心雨、李心正、李绪凤、刘晋冉、庞林君、苏梦雅、孙博文、孙海蛟、孙宁、王力平、王硕、谢克玲、于杰、于新新、袁晓燕、袁智伟、张海山、张廉睿、张林、赵焕彬、禚增旭

微信图片_20220924150002.jpg

   本课程的核心内容是自动化数据抓取和文本挖掘的方法。在大数据时代,这些技术为各专业领域的研究者提供了强大的工具,使得任何人都可以像自然科学家一样通过建模、采集数据和统计分析得到定量的结果,从而支持他们的结论。

   基于本课程的学习和个人研究兴趣,分七组完成大课题研究。具体研究课题如下:

   1. 旅游景区在线文本情感分析 ——以泰山游客评论为例

1. 旅游景区在线文本情感分析 ——以泰山游客评论为例.pdf

      2. 基于文本挖掘的影评分析---以《让子弹飞》为例

2. 基于文本挖掘的影评分析---以《让子弹飞》为例.pdf

        3. 基于网络爬虫对2022年网易新闻评论数据分析

3. 基于网络爬虫对2022年网易新闻评论数据分析.pdf

        4. 基于主题—情感挖掘模型的汤臣倍健褪黑素产品评论分析

4. 基于主题—情感挖掘模型的汤臣倍健褪黑素产品评论分析.pdf

        5. 曲阜文旅市场调查分析研究

5. 曲阜文旅市场调查分析研究.pdf

        6. 基于数据挖掘的音乐软件受欢迎度研究

6. 基于数据挖掘的音乐软件受欢迎度研究.pdf

        7. 李宁品牌鞋类的评论数据情感分析

7. 李宁品牌鞋类的评论数据情感分析.pdf




https://blog.sciencenet.cn/blog-3316039-1356666.html

上一篇:网络数据采集方法及其应用
收藏 IP: 121.250.0.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 20:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部