PCA的正确/错误打开方式(应用)
2020-09-27 本文已影响0人
Pingouin
Ref:安德鲁老师的经典ML intro课程
PCA适用于 | PCA不适用于 | |
---|---|---|
speed up learning algorithm | ✅ | |
避免overfitting | ✅ | |
数据可视化时对数据进行压缩 | ✅ | |
design of ML system | ✅ |
避免overfitting的问题
Regularization比PCA更好:因为PCA可能会舍弃掉有用的信息(比如在降低dimension的时候保留了99%的feature),而regularization是保留了所有feature。
PCA不正确的打开方式1号
Design of ML system(其实和speed up learning algorithm那一项是一回事)
建议在用PCA之前,要知道自己在做什么,先考虑原始数据x(i)看效果。因为可能原始数据不使用PCA效果就ok了。如果原始数据的learning algorithm很慢,或者内存需求很大,换句话说你明确了x(i)不可用,再使用PCA或者考虑使用compressed representation。
PCA的不正确打开方式2号