ChenChengHUST的个人博客分享 http://blog.sciencenet.cn/u/ChenChengHUST

博文

[转载]机器学习kaggle比赛准备

已有 1531 次阅读 2020-2-17 09:18 |个人分类:科研|系统分类:科研笔记| 机器学习 |文章来源:转载

0基础的人如何上手Kaggle?

理论上来讲,Kaggle欢迎任何数据科学的爱好者,不过实际上,要想真的参与其中,还是有一定门槛的。一般来讲,参赛者最好具有统计、计算机或数学相关背景,有一定的coding技能,对机器学习和深度学习有基本的了解。Kaggle任务虽然不限制编程语言,但绝大多数队伍会选用Python和R,所以你应该至少熟悉其中一种。此外,对于那些对成绩有追求的人,Feature Engineering也是必不可少的。

当然,如果你从未独立做过一个项目,还是要从练习赛开始熟悉。因为竞赛模式中的任务是公司悬赏发布的实际案例,并没有标准的答案;而练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行提高。所以呢,建议感兴趣的同学先去独立做一下101和playground的训练赛,至于做多少个案例才能上道,就要看个人素质啦。这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的两个经典练习项目,供大家学习。


1. Titanic(泰坦尼克之灾)

中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾 (点击查看)

英文教程: An Interactive Data Science Tutorial (点击查看)

2. House Prices: Advanced Regression Techniques(房价预测)

中文教程: Kaggle竞赛 — 2017年房价预测 (点击查看)

英文教程: How to get to TOP 25% with Simple Model using sklearn (点击查看)

3. Digital Recognition(数字识别)

中文教程: 大数据竞赛平台—Kaggle 入门 (点击查看)

英文教程: Interactive Intro to Dimensionality Reduction (点击查看)


资源:

这里有超级良心的手把手教程, 如何在 Kaggle 首战中进入前 10% , 详细介绍了Kaggle项目的大致流程,包括Data Exploration, Statistical Test, Data Processing, Feature Engineering, Model Selection, Ensemble Generation每一步该怎么做,有哪些Tips,最后还给出了一个“Home Depot Search Relevance”的案例,拿到它就可以开始自己的Kaggle排位赛了!祝愿大家都能够成为一个优秀的Data Scientist!

接下来是我整理的一些相关的学习资源,大家各取所需。

  • 基础准备篇之Python

廖雪峰

怎么用最短时间高效而踏实地学习 Python?

你是如何自学 Python 的?

在线教育网站(Coursera网易云edx课堂腾讯课堂等)有哪些值得推荐的 Python 教程?

  • 基础准备篇之R

业余时间如何学数据分析?

如何高效地学好 R?

好看的数据可视化的图片是怎么样做的?

  • 基础准备篇之Machine Learning

机器学习该怎么入门?

深度学习如何入门?

JustFollowUs/Machine-Learning

  • 基础准备篇之Kaggle Experience

从Python菜鸟到Python Kaggler的过程:

Python机器学习实践与Kaggle实战

经常更新的的大数据博客

TO最爱学习的你:国外大数据博客资源大全 | 36大数据

How to start doing Kaggle competitions?

What do top Kaggle competitors focus on?

A Journey Into Data Science

Techniques to improve the accuracy of your Predictive Models

转载自:http://www.360doc.com/content/18/0106/16/44422250_719580875.shtml



https://blog.sciencenet.cn/blog-3428468-1218897.html


下一篇:关于矩阵的Schur补
收藏 IP: 27.23.211.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 17:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部