机器学习

2019-05-26  本文已影响0人  洛奇lodge

机器学习

1、什么是机器学习?

机器学习,是人工智能一个基本条件,是建立大数据基础之上。从数据中提取出模型,并可以利用模型对未知的数据做出预测

机器学习算法分类又分为监督学习和无监督学习

机器学习一个流程图:

2、机器学习算法

2.1、K-近邻算法(KNN)

2.1.1、算法介绍
2.1.2、算法的API接口

sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto')

2.1.3、模型选择与调优API

sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)

参数描述

属性描述

2.2、朴素贝叶斯分类算法

2.2.1、算法介绍
2.2.2、算法的API接口

sklearn.naive_bayes.MultinomialNB(alpha = 1.0)

2.3、决策树算法

2.3.1、算法介绍
2.3.2、算法的API接口

sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)

2.4、随机森林算法

2.4.1、算法介绍
2.4.2、算法的API接口

sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion=’gini’, max_depth=None, bootstrap=True, random_state=None, min_samples_split=2)

超参数:n_estimator, max_depth, min_samples_split,min_samples_leaf

2.5、逻辑回归算法

2.5.1、算法介绍
2.5.2、算法的API接口

sklearn.linear_model.LogisticRegression(solver='liblinear', penalty=‘l2’, C = 1.0)

2.6、线性回归算法

2.6.1、算法介绍
2.6.2、算法的API接口

正规方程

sklearn.linear_model.LinearRegression(fit_intercept=True)

梯度下降

sklearn.linear_model.SGDRegressor(loss="squared_loss", fit_intercept=True, learning_rate ='invscaling', eta0=0.01)

2.7、岭回归算法

2.7.1、算法介绍
2.7.2、算法的API接口

sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True,solver="auto", normalize=False)

2.8、k-means算法

2.8.1、算法介绍
2.8.2、算法的API接口

sklearn.cluster.KMeans(n_clusters=8,init=‘k-means++’)

3、模型保存和加载

from sklearn.externals import joblib

4、算法评估

4.1、分类评估

4.2 聚类评估

上一篇 下一篇

猜你喜欢

热点阅读