机器学习与深度学习

20、4个自学机器学习项目

2019-02-23  本文已影响26人  攻城狮笔记

机器学习领域有很多途径,大部分都是从理论开始的。

如果您是程序员,那么您已经掌握了将问题分解为其组成部分并对小型项目进行原型设计的技能,以便学习新技术,库和方法。这些是任何专业程序员的重要技能,今天这些技能可用于开始机器学习。

这些是任何专业程序员的重要技能,今天这些技能可用于开始机器学习。

自习

自我研究
摄影:gfairchild,保留一些权利

你必须学会​​理论才能在机器学习中发挥作用,但你可以利用自己的兴趣和对知识的渴求来激励你从工作实例到算法的数学理解。

在这篇文章中,您将学习程序员可以遵循的四种策略来开始机器学习。这是技术人员的路径,这是实用和经验性的,需要您进行研究和完成实验,以建立自己的直觉。

四种策略是:

  1. 学习机器学习工具
  2. 研究机器学习数据集
  3. 研究机器学习算法
  4. 实现机器学习算法

仔细阅读这些策略并选择一个最适合您的策略,然后放弃执行。

1.学习机器学习工具

选择您喜欢的工具或库,并学习如何使用它。

我建议您从一个提供数据准备工具,机器学习算法和结果表示的环境开始。学习这样的环境可以让您熟悉端到端的机器学习过程,这对您来说比学习特定的数据准备技术或机器学习算法更有价值。

或者,也许您对一系列技术的特定技术感兴趣。您可以将此作为深入了解提供这些方法的库或工具的机会,并通过掌握提供该技术访问权限的库来掌握该技术。

image.png

研究机器学习工具
照片由zzpza提供,保留一些权利

您可以遵循此策略的一些策略是:

您应该考虑的一些环境包括:RWekascikit-learn华夫饼橙色

2.研究机器学习数据集

选择一个数据集并密切了解它,并发现哪个算法类或类型最适合它。

我建议你选择适合内存的适度大小的数据集,以前可能已经进行了很好的研究。有很多优秀的数据源库供您浏览和选择。您的目标是了解数据源所代表的基本问题,数据集中的结构以及最适合该问题的解决方案类型。

使用机器学习或统计环境来研究数据集。这将使您能够专注于您想要回答的有关数据集的问题,而不是分心学习给定技术并学习如何在代码中实现它。

image.png

研究机器学习数据集
照片由abhidg提供,保留一些权利

一些可以帮助您研究实验机器学习数据集的策略是:

您可能要考虑的一些高质量数据集存储库是:UCI ML RepositoryKaggledata.gov

3.研究机器学习算法

选择一种算法并密切理解它,并发现在不同数据集中稳定的参数配置。

我建议你从一个适度复杂的算法开始。选择一个很好理解的算法,有许多开源实现供您选择,并且您可以使用很少的参数进行探索。您的目标是建立算法如何在一系列问题和参数配置中执行的直觉。

使用机器学习环境或库。这将使您能够专注于算法的行为作为“系统”,而不是关注自己的规范数学描述和参考文献。

image.png

研究机器学习算法
照片不受人才阻碍,保留一些权利

在研究您选择的机器学习算法时,您可以使用的一些策略是:

您的学习可以像您一样简单或复杂。在高端,您可以探索所谓的启发式或经验法则,以应用算法并凭经验证明它们是否具有优点,如果是,在什么情况下它们与成功结果相关联。

您可能考虑开始的一些算法包括:最小二乘线性回归,逻辑回归,k-最近邻分类,感知器

4.实现机器学习算法

选择算法并将现有实现实现或移植到您选择的语言。

选择要实现的适度复杂度的算法。我建议对要实现的算法进行一些详细的研究,或者选择您喜欢的实现并将其移植到您选择的目标编程语言。

从头开始实施算法是了解在将算法描述转换为功能系统时必须做出的无数微决策的好方法。通过使用多种算法重复此过程,您将很快获得如何阅读研究论文和书籍中算法的数学描述的直觉。

实现机器倾斜算法

实现机器学习算法
照片由Nic的事件,保留一些权利

从头开始实施机器学习算法可能有助于您的五种策略是:

小项目方法论

四种策略是我称之为“小项目”的方法。这是一种可以用来快速建立技术学习领域的实用技能的方法,如机器学习。一般的想法是,您可以针对要回答的特定问题的小项目进行设计和执行。

小项目在一些方面很小,以确保它们完成,并提取学习优势并进入下一个项目。以下是您应考虑对项目施加的限制:

其他项目提示

这些策略的原则是采取行动并利用您的程序员技能。以下三个提示可帮助您调整思路以采取行动:

摘要

这里是尺寸策​​略,每个都有一个明确的单行,以帮助您选择适合您的。

  1. 学习机器学习工具:选择您喜欢的工具或库,并学习如何使用它。
  2. 研究机器学习数据集:选择一个数据集并密切了解它,并发现哪个算法类或类型最适合它。
  3. 研究机器学习算法:选择一种算法并对其进行密切理解,并发现在不同数据集中稳定的参数配置。
  4. 实现机器学习算法:选择算法并将现有实现实现或移植到您选择的语言。

选一个!

上一篇下一篇

猜你喜欢

热点阅读