wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

网络数据采集方法及其应用

已有 3612 次阅读 2021-7-12 09:58 |系统分类:论文交流

         微信图片_20210507173127.jpg

          2021.03-2021.04曲阜师范大学统计学院王文武博士主持讨论《基于R语言的自动数据收集---Web数据抓取和文本挖掘》(Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining)。参加讨论的硕士研究生有16名,他们分别是:蔡亚楠,陈阔,陈云玉,董俊鑫,宫哲,郭金,郝贵迎,李艳茹,刘佳汭,刘恺,刘力源,刘新静,马悦泽,潘淑霞,秦超超,阮丰硕,王军华,温鑫,薛美晨,张蕾,张晓悦,郑丹丹

   本课程的核心内容是自动化数据抓取和文本挖掘的方法。在大数据时代,这些技术为各专业领域的研究者提供了强大的工具,使得任何人都可以像自然科学家一样通过建模、采集数据和统计分析得到定量的结果,从而支持他们的结论。

   基于本课程的学习和个人研究兴趣,分组完成大课题研究。具体研究课题如下:

1. 基于协同过滤算法的电影推荐系统

陈云玉、郑丹丹、蔡亚楠、秦超超---基于协同过滤算法的电影推荐系统

2. 基于 R 的保健品数据采集与分析

宫哲、郭金、李艳茹、刘力源---基于 R 的保健品数据采集与分析

3. SKII产品评论数据情感分析

郝贵迎、张晓悦、张蕾---SKII产品评论数据情感分析

4. 基于文本挖掘的空调评论分析


刘佳汭、董俊鑫、陈阔---基于文本挖掘的空调评论分析


5. 基于网络文本分析的北京市旅游市场复苏报告


马悦泽、刘恺、温鑫、阮丰硕---基于网络文本分析的北京市旅游市场复苏报告


6. 基于数据挖掘的北京烤鸭文本分析


潘淑霞、薛美晨、王军华、刘新静---基于数据挖掘的北京烤鸭文本分析






https://blog.sciencenet.cn/blog-3316039-1295115.html

上一篇:[转载]曲阜师范大学国家级一流本科专业---统计学
下一篇:数据采集方法案例分析-2022
收藏 IP: 118.140.125.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 14:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部