||| |
0基础的人如何上手Kaggle?
理论上来讲,Kaggle欢迎任何数据科学的爱好者,不过实际上,要想真的参与其中,还是有一定门槛的。一般来讲,参赛者最好具有统计、计算机或数学相关背景,有一定的coding技能,对机器学习和深度学习有基本的了解。Kaggle任务虽然不限制编程语言,但绝大多数队伍会选用Python和R,所以你应该至少熟悉其中一种。此外,对于那些对成绩有追求的人,Feature Engineering也是必不可少的。
当然,如果你从未独立做过一个项目,还是要从练习赛开始熟悉。因为竞赛模式中的任务是公司悬赏发布的实际案例,并没有标准的答案;而练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行提高。所以呢,建议感兴趣的同学先去独立做一下101和playground的训练赛,至于做多少个案例才能上道,就要看个人素质啦。这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的两个经典练习项目,供大家学习。
1. Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾 (点击查看)
英文教程: An Interactive Data Science Tutorial (点击查看)
2. House Prices: Advanced Regression Techniques(房价预测)
中文教程: Kaggle竞赛 — 2017年房价预测 (点击查看)
英文教程: How to get to TOP 25% with Simple Model using sklearn (点击查看)
3. Digital Recognition(数字识别)
中文教程: 大数据竞赛平台—Kaggle 入门 (点击查看)
英文教程: Interactive Intro to Dimensionality Reduction (点击查看)
资源:
这里有超级良心的手把手教程, 如何在 Kaggle 首战中进入前 10% , 详细介绍了Kaggle项目的大致流程,包括Data Exploration, Statistical Test, Data Processing, Feature Engineering, Model Selection, Ensemble Generation每一步该怎么做,有哪些Tips,最后还给出了一个“Home Depot Search Relevance”的案例,拿到它就可以开始自己的Kaggle排位赛了!祝愿大家都能够成为一个优秀的Data Scientist!
接下来是我整理的一些相关的学习资源,大家各取所需。
基础准备篇之Python
廖雪峰
在线教育网站(Coursera网易云edx课堂腾讯课堂等)有哪些值得推荐的 Python 教程?
基础准备篇之R
基础准备篇之Machine Learning
基础准备篇之Kaggle Experience
How to start doing Kaggle competitions?
What do top Kaggle competitors focus on?
Techniques to improve the accuracy of your Predictive Models
转载自:http://www.360doc.com/content/18/0106/16/44422250_719580875.shtml
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-19 17:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社