wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

数据自动采集、挖掘与统计学习案例库

已有 713 次阅读 2024-11-13 19:57 |个人分类:研究生课程论文|系统分类:教学心得

          2023年03月-06月和2024年03月-06月,曲阜师范大学统计与数据科学学院王文武教授主持讨论课程《基于R语言的自动数据收集---Web数据抓取和文本挖掘》(Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining)两次。参加讨论的硕士研究生为2022、2023级应用统计专业硕士和部分统计学学术硕士。

   本课程的核心内容是自动化数据抓取和文本挖掘的方法。在大数据时代,这些技术为各专业领域的研究者提供了强大的工具,使得任何人都可以像自然科学家一样通过建模、采集数据和统计分析得到定量的结果,从而支持他们的结论。

   基于本课程的学习和学生个人研究兴趣,分15组完成大课题研究。基于这些案例,建设山东省优质案例库“数据自动采集、挖掘与统计学习案例库”。具体研究课题如下:

    1. 基于文本挖掘的手机评论分析

1. 基于文本挖掘的手机评论分析.pdf

          2. 关于春节档电影热度与在线评论的情感分析

2. 关于春节档电影热度与在线评论的情感分析.pdf

          3. 基于文本挖掘对无糖饮料消费关注网络评价分析

3. 基于文本挖掘对无糖饮料消费关注网络评价分析.pdf

        4. 文化数字化评价体系构建及实证分析

4. 文化数字化评价体系构建及实证分析.pdf

          5. 现实题材电视剧如何出圈——基于对《狂飙》评论数据分析

5. 现实题材电视剧如何出圈——基于对《狂飙》评论数据分析.pdf

           6. 鲁西南地区大气污染物预测和关联分析基于机器学习和关联规则算法

6. 鲁西南地区大气污染物预测和关联分析基于机器学习和关联规则算法.pdf

          7. 基于机器学习的豆瓣影评文本分析——以《速度与激情10》为例

7. 基于机器学习的豆瓣影评文本分析——以《速度与激情10》为例.pdf

          8. 基于价格分类的京东手机商品评论的文本挖掘应用研究

8. 基于价格分类的京东手机商品评论的文本挖掘应用研究.pdf

          9. 融合双通道文本分类模型的网络爬取及知识图谱分析——以“机器学习”领域的知网文献为例

icon_txt.gif9. 融合双通道文本分类模型的网络爬取及知识图谱分析——以“机器学习”领域的知网文献为例.pdf

          10. 基于数据挖掘的天气数据及空气质量的探索研究

10. 基于数据挖掘的天气数据及空气质量的探索研究.pdf

          11. 基于文本挖掘技术的智能扫地机器人商品评论情感倾向分析

11. 基于文本挖掘技术的智能扫地机器人商品评论情感倾向分析.pdf

          12. 基于文本挖掘的“考研热”情感分析研究 ——以 B 站在线评论弹幕为例

12. 基于文本挖掘的“考研热”情感分析研究 ——以 B 站在线评论弹幕为例.pdf

          13. 陪诊市场发展因素分析与预测

13. 陪诊市场发展因素分析与预测.pdf

          14. 基于机器学习模型的糖尿病预测系统研究

14. 基于机器学习模型的糖尿病预测系统研究.pdf

          15. 京东生鲜平台在线评论挖掘分析

15. 京东生鲜平台在线评论挖掘分析.pdf

        



https://blog.sciencenet.cn/blog-3316039-1459901.html

上一篇:数据采集方法案例分析-2022
收藏 IP: 120.224.66.*| 热度|

1 xtn

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-17 10:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部