《动手学深度学习》第七天2020-02-20

2020-02-20 本文已影响0人 _a30a

https://www.boyuai.com/elites/

Task08：文本分类；数据增强；模型微调

一、文本分类

文本分类: 把一段不定长的文本序列变换为文本的类别.

子问题：使用文本情感分类来分析文本作者的情绪，也叫情感分析。

同搜索近义词和类比词一样，文本分类也属于词嵌入的下游应用。

1、文本情感分类数据集

2、使用循环神经网络进行情感分类

3、使用卷积神经网络进行情感分类.

二、数据增强

图像增广（image augmentation）技术通过对训练图像做一系列随机改变，来产生相似但又不同的训练样本，从而扩大训练数据集的规模。图像增广的另一种解释是，随机改变训练样本可以降低模型对某些属性的依赖，从而提高模型的泛化能力。

例如，我们可以对图像进行不同方式的裁剪，使感兴趣的物体出现在不同位置，从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。

三、模型微调

微调（fine tuning）是迁移学习中的一种常用技术。
迁移学习（transfer learning），将从源数据集学到的知识迁移到目标数据集上。例如，虽然ImageNet数据集的图像大多跟椅子无关，但在该数据集上训练的模型可以抽取较通用的图像特征，从而能够帮助识别边缘、纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。

1热狗识别例子

《动手学深度学习》第七天2020-02-20

猜你喜欢

热点阅读