python實現線性回歸 python實現線性回歸

參考：《機器學習實戰》- machine learning in action

一、必備的包

一般而言，這幾個包是比較常見的：

• matplotlib，用於繪圖

• numpy，陣列處理庫

• pandas，強大的資料分析庫

• sklearn，用於線性回歸的庫

• scipy，提供很多有用的科學函式

我一般是用pip安裝，若不熟悉這些庫，可以搜尋一下它們的簡單教程。

二、線性回歸

典型的例子是房價**，假設我們有以下資料集：

我們需要通過訓練這些資料得到乙個線性模型，以便來**大小為700平方英呎的房價是多少。

詳細**如下：

importmatplotlib.pyplot as pltimportnumpy as npimportpandas as pdfrom sklearn importdatasets, linear_modeldefget_data(file_name):

data=pd.read_csv(file_name)

x_parameter=

y_parameter=for single_square_feet ,single_price_value in zip(data['square_feet'],data['price']):

regr=linear_model.linearregression()

regr.fit(x_parameters, y_parameters)

predict_outcome=regr.predict(predict_value)

predictions={}

predictions['intercept'] =regr.intercept_

predictions['coefficient'] =regr.coef_

predictions['predicted_value'] =predict_outcomereturnpredictionsdefshow_linear_line(x_parameters,y_parameters):

regr=linear_model.linearregression()

regr.fit(x_parameters, y_parameters)

plt.scatter(x_parameters,y_parameters,color='blue')

plt.plot(x_parameters,regr.predict(x_parameters),color='red',linewidth=4)#plt.xticks(())

#plt.yticks(())

plt.show()if __name__ == "__main__":

x,y= get_data('e:/machine_learning/lr/input_data.csv')#show_linear_line(x,y)

predictvalue = 700result=linear_model_main(x,y,predictvalue)print "intercept value" , result['intercept']print "coefficient" , result['coefficient']print "predicted value:",result['predicted_value']

結果如圖：

前兩個為公式裡的引數。

三、多項式回歸

簡單的線性模型誤差難免高，於是引入多項式回歸模型，方程式如下：

這次我們用scipy.stats中的norm來生成滿足高斯分布的資料，直接貼**：

#encoding:utf-8

importmatplotlib.pyplot as pltimportnumpy as npfrom scipy.stats importnormfrom sklearn.pipeline importpipelinefrom sklearn.linear_model importlinearregression, sgdclassifierfrom sklearn.preprocessing importpolynomialfeatures, standardscaler

x= np.arange(0, 1, 0.002)

y= norm.rvs(0, size=500, scale=0.1) #高斯分布資料

y = y + x**2plt.scatter(x, y, s=5)

y_test=

y_test=np.array(y_test)#clf = linearregression(fit_intercept=false)

clf = pipeline([('poly', polynomialfeatures(degree=100)),

('linear', linearregression(fit_intercept=false))])

clf.fit(x[:, np.newaxis], y)

y_test=clf.predict(x[:, np.newaxis])

plt.plot(x, y_test, linewidth=2)

plt.grid()#顯示網格

plt.show()

結果如下：

這裡取的最高次為100

python實現線性回歸 python實現線性回歸

python實現線性回歸

python實現線性回歸

python實現線性回歸

相關推薦