大工至善|大学至真分享 http://blog.sciencenet.cn/u/lcj2212916

博文

[转载]【机器学习开放项目】教育数据挖掘

已有 2372 次阅读 2019-2-5 11:11 |系统分类:科研笔记|文章来源:转载


开放的教育数据挖掘数据集合网站:

https://pslcdatashop.web.cmu.edu/ 


项目思路1

对于每个数据集,您可以比较各种机器学习技术(至少5到7种不同的ML方法),以预测“正确的首次尝试值”。

For each dataset, you can compare various machine learning techniques (at least five to seven different ML methods) on predicting "Correct First Attempt values" (Generally listed in the column "Outcome"). 


报告相应的均方根误差(RMSE)。

Please report the Root Mean Squared Error (RMSE).


项目思路2

在数据集中,您可以比较多种机器学习技术(至少2到3种不同的ML方法),以预测“正确的首次尝试值”。

Across datasets, you can compare several machine learning techniques (at least two to three different ML methods) on predicting "Correct First Attempt values"(Generally listed in the column "Outcome"). 


报告测试数据的均方根误差(RMSE)。

Please report the Root Mean Squared Error (RMSE) on the test data. 


这里的假设前提是,可能没有绝对的赢家,不同的机器学习技术可能对不同的任务领域有效

The hypothesis here is that there may not be an absolute winner, different machine learning techniques may be effective on different task domains. 


例如,您可以将数据集分为科学(物理和数学)和第二语言学习(中文、法语)。

For example, you can split the datasets into science (physics & math) vs. second language learning (Chinese, French).


更多精彩文章请关注微信号:qrcode_for_gh_60b944f6c215_258.jpg



https://blog.sciencenet.cn/blog-69686-1160799.html

上一篇:[转载]【读书2】【2014】基于MATLAB的雷达信号处理基础(第二版)——雷达散射截面的统计描述(3)
下一篇:[转载]【源码】红蓝配色图——从亮蓝色到白色再到亮红色
收藏 IP: 183.160.73.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-10-19 22:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部