python 简单线性回归

2017-09-17  本文已影响0人  正在充电Loading

import numpy;

from pandas import read_csv;

from matplotlib import pyplot as plt;

from sklearn.linear_model import LinearRegression

data = read_csv(

'D:\\PDM\\4.1\\data.csv'

)

Out[2]:

#第二步,画出散点图,求x和y的相关系数

plt.scatter(data.广告投入, data.销售额)

data.corr()

广告投入      销售额

广告投入  1.000000  0.906923

销售额  0.906923  1.000000

#第三步,估计模型参数,建立回归模型

lrModel = LinearRegression()

x = data[['广告投入']]

y = data[['销售额']]

#训练模型

lrModel.fit(x, y)

#第四步、对回归模型进行检验

lrModel.score(x, y)

lrModel.fit(x, y)

Out[4]: LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

lrModel.score(x, y)

Out[5]: 0.82250928811669455

#第五步、利用回归模型进行预测

lrModel.predict([[50], [40], [30]])

out:array([[ 150.53303965],

[ 113.15418502],

[  75.7753304 ]])

#查看截距

alpha = lrModel.intercept_[0]

#查看参数

beta = lrModel.coef_[0][0]

alpha + beta*numpy.array([50, 40, 30])

array([ 150.53303965,  113.15418502,  75.7753304 ])

上一篇 下一篇

猜你喜欢

热点阅读