Structuring Machine Learning Pro

2018-12-06  本文已影响23人  geekpy

第二周课程目标

Understand what multi-task learning and transfer learning are
Recognize bias, variance and data-mismatch by looking at the performances of your algorithm on train/dev/test sets

Error Analysis

通常针对有监督学习,为了提高准确率,降低错误率,我们需要分析错误的原因是什么,这就涉及到error analysis。通常的做法是可以看下具体是哪些item进行了错误的分类,然后可以整理出如下图所示的表格,从而可以判断接下来应该如何降低错误率。


error analysis

在进行错误分析的时候,也需要注意有些情况下并不是我们的算法有问题,而是样本标记错误导致的。针对这种情况,就需要分析这类错误所占的比例是多少,即可以在上图的表格当中加入一列'error labeled',如果所占比例较大,则说明需要去针对错误样本进行重新标记,但是如果比例很小,则不值得我们花精力去做这件事,而且通常DL算法对错误样本是有很强的容忍性的,即可以允许部分样本的错误,对算法的准确度影响很小。 针对标记错误的样本,当我们判断需要进行更正的时候,那么有以下原则需要考虑:


rules for updating labels

另外,Andrew还强调了要尽快建立第一个模型,然后再通过分析是bias问题还是variance问题来决定下一步的方向,逐渐地迭代改进。这很类似于现在的互联网产品理念,即最小模型原则,先建立一个基本的原型产品,再跟进用户反馈快速迭代。所以一开始最好不要想太多,先做出第一个原型产品再说。

Mismatched training and dev/testing set

这一节主要讲当training set和dev/test set并非同一个distribution的时候如何处理。当我们只有很小量的实际数据,但是有大量的非实际场景数据(但是仍然是可以迁移使用的,比如都是图片),这时一种直观的做法是将所有的数据混合在一起,shuffle之后再按比例切分,但是这种情况下就存在一个问题,我们的dev/test中存在的数据大部分都是非实际场景的数据,这导致了我们的训练的target就已经不准确了,所以更好的做法是,所有的dev/test set的数据均来源于实际场景的数据,而添加一部分实际场景的数据到training set。

但是,当training set和dev/test set来自不同的distribution的时候又会带来一个问题,即当training set的error rate和dev set的error rate有较大差距的时候,我们怎么判断是存在variance问题,还是由于dev set的数据本身更加难以识别导致的,即有两种可能的因素,那么如何区分这两个因素呢?Andrew在这里提到了一个新的概念,training-dev set,如下图所示:

what's the reason of error rate difference

那么问题来了,当我们发现data mismatch问题时,我们该如何处理了,总的来说有两步,如下图所示:


deal with data mismatch

那么如何让训练集中数据更像dev set中的数据呢,这主要是通过两种方式来实现:

生成模拟数据需要注意的是,我们的生成数据因为只是实际数据的一个非常小的子集,这可能导致我们的模型针对这部分数据过拟合。

Learning for multiple tasks

作者首先在这节讲述了什么是transfer learning


transfer learning

那么在什么情况下我们需要使用transfer learning呢?


when transfer learning makes sense

接下来讲了什么是multi-task learning


auto driving example

Multiclass classification means a classification task with more than two classes; e.g., classify a set of images of fruits which may be oranges, apples, or pears. Multiclass classification makes the assumption that each sample is assigned to one and only one label: a fruit can be either an apple or a pear but not both at the same time.
Multilabel classification assigns to each sample a set of target labels. This can be thought as predicting properties of a data-point that are not mutually exclusive, such as topics that are relevant for a document. A text might be about any of religion, politics, finance or education at the same time or none of these.

下图展示了一个multi-task neural network:


multi-class neural network

那么什么情况下multi-task learning是有意义的?


when multi-task learning makes sense

End-to-end deep learning

什么是end-to-end deep learning?作者首先举了个例子


end-to-end learning

之后,作者举了个人脸识别的例子,这个例子表明有的时候分步进行又是有意义的:


face recognition

那么什么情况下使用end-to-end,什么情况下使用分步法比较好呢?
这通常跟我们的数据有极大的关系,当我们有大量的input和output数据的时候,我们可以直接使用end-to-end的方式,但是当我们的数据的模式是input->step output, step output-> output的时候,那么我们就需要分步来做,总的来说跟你的数据模式有关系。

上一篇 下一篇

猜你喜欢

热点阅读