数据分析类kaggle数据分析

Kaggle数据挖掘竞赛入门系列:(一)Kaggle简介

2017-09-17  本文已影响579人  王十二的

Kaggle是全球最大的数据分析在线平台,吸引了全球范围内数十万的顶级数据科学家,同时也是检测我们机器学习技能的最佳平台。

一、Kaggle简介

Kaggle成立于2010年,网址:https://www.kaggle.com/

这里写图片描述
Kaggle是全球范围内最大的数据众包平台。
企业或者研究者与Kaggle合作之后,可以将数据、问题描述、期望的指标发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案,类似于KDD-CUP(国际知识发现和数据挖掘竞赛)。
Kaggle上的参赛者将数据下载下来,分析数据,然后运用机器学习、数据挖掘等知识,建立算法模型,解决问题得出结果,最后将结果提交,如果提交的结果符合指标要求并且在参赛者中排名第一,将获得比赛丰厚的奖金。

二、参加Kaggle比赛的基本流程

1.选择一个比赛项目

这里写图片描述

2.加入竞赛,理解项目需求“Competition Details”

这里写图片描述

3.下载数据,训练模型,得出结果“Get the Data”

这里写图片描述

4.提交结果“Make a submission”

这里写图片描述

三、解题思路

模仿是最好的学习方式!

这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。
1.Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
英文教程:An Interactive Data Science Tutorial

2.House Prices: Advanced Regression Techniques(房价预测)
中文教程:Kaggle竞赛 — 2017年房价预测
英文教程:How to get to TOP 25% with Simple Model using sklearn

3.Digital Recognition(数字识别)
中文教程:大数据竞赛平台—Kaggle 入门
英文教程:Interactive Intro to Dimensionality Reduction

欢迎关注微信公众号:kaggle数据分析

上一篇下一篇

猜你喜欢

热点阅读