动手学深度学习PyTorch版

《动手学深度学习》第七天2020-02-20

2020-02-20  本文已影响0人  _a30a

https://www.boyuai.com/elites/

Task08:文本分类;数据增强;模型微调

一、文本分类

文本分类: 把一段不定长的文本序列变换为文本的类别.

子问题:使用文本情感分类来分析文本作者的情绪,也叫情感分析。

同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。

1、文本情感分类数据集 

2、使用循环神经网络进行情感分类 

3、使用卷积神经网络进行情感分类.

二、数据增强

图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。

三、模型微调

微调(fine tuning)是迁移学习中的一种常用技术。
迁移学习(transfer learning),将从源数据集学到的知识迁移到目标数据集上。例如,虽然ImageNet数据集的图像大多跟椅子无关,但在该数据集上训练的模型可以抽取较通用的图像特征,从而能够帮助识别边缘、纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。

1热狗识别例子

上一篇下一篇

猜你喜欢

热点阅读