《Python深度学习》第四章笔记

2019-04-07  本文已影响0人  ZzzZBbbB

术语表:

评估数据(划分数据集)的注意事项

数据代表性(data representativeness): 随机打乱数据
时间箭头(the arrow of time):时间预测类问题需要保证测试集中所有数据的时间都晚于训练集数据
数据冗余(redundancy in your data):确保训练集和验证集之间没有交集

特征工程

用更简单的方式表述问题,从而使问题变得更容易。(它通常需要深入理解问题)

神经网络的数据预处理

过拟合与欠拟合

优化(optimization):调节模型以在训练数据上得到最佳性能(即机器学习中的学习)
泛化(generalization):训练好的模型在前所未见的数据上的性能好坏

模型随着训练迭代次数的增加,一般是由欠拟合到过拟合状态过渡

降低过拟合的方法:

机器学习的流程

上一篇下一篇

猜你喜欢

热点阅读