sklearn學習筆記之嶺回歸

嶺回歸是一種專用於共線性資料分析的有偏估計回歸方法，實質上是一種改良的最小二乘估計法，通過放棄最小二乘法的無偏性，以損失部分資訊、降低精度為代價獲得回歸係數更為符合實際、更可靠的回歸方法，對病態資料的擬合要強於最小二乘法。

乙個簡單的例子

from sklearn.linear_model import ridge
clf = ridge(alpha=.5)
x = [[0,0],[0,0],[1,1]]
y = [0,.1,1]
clf.fit(x,y)
print(clf.coef_)
print(clf.intercept_)

執行結果如下：

例項化ridge類已經設定了一系列預設的引數，因此clf = ridge()即可以完成例項化。

但是，了解一下它的引數還是有必要的：

注：後四個方法都支援稀疏和密集資料，而sag僅在fit_intercept為true時支援密集資料。

tol：精度

random_state：sag的偽隨機種子

以上就是所有的初始化引數，當然，初始化後還可以通過set_params方法重新進行設定。

回歸分析

在例項化ridge類以後，就可以直接使用ridge中整合的方法來進行回歸了，與絕大多數的sklearn類一樣，ridge使用fit方法執行計算

得到回歸函式後，我們可以通過predict來使用回歸函式。

對於模型的好壞，ridge當然提供了評價的方法——score

在sklearn中並沒有提供直接的檢視回歸方程的函式，因此檢視的時候需要自己轉化一下。其實，sklearn就是把相關係數和殘差分開儲存了，因此，檢視的時候要呼叫coef_和intercept_兩個屬性。

可能有用的方法

這些方法在sklearn的基類中就已經整合，但在一般情況下，通常不會用到。

以上就是ridge的總體介紹，在現實生活中，一般不會想上面的例項中的直接使用定值來計算，下面是乙個更實際一點的例子：

# author: fabian pedregosa -- 
# license: bsd 3 clause
import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model
# x is the 10x10 hilbert matrix
x = 1. / (np.arange(1, 11) + np.arange(0, 10)[:, np.newaxis])
y = np.ones(10)
######
######
######
######
######
######
######
######
######
######
######
######
######
## compute paths
n_alphas = 200
alphas = np.logspace(-10, -2, n_alphas)
clf = linear_model.ridge(fit_intercept=false)
coefs = 
for a in alphas:
clf.set_params(alpha=a)
clf.fit(x, y)
######
######
######
######
######
######
######
######
######
######
######
######
######
## display results
ax = plt.gca()
ax.set_color_cycle(['b', 'r', 'g', 'c', 'k', 'y', 'm'])
ax.plot(alphas, coefs)
ax.set_xscale('log')
ax.set_xlim(ax.get_xlim()[::-1]) # reverse axis
plt.xlabel('alpha')
plt.ylabel('weights')
plt.title('ridge coefficients as a function of the regularization')
plt.axis('tight')
plt.show()

這個例子中，alpha為1e-10~1e-2，以對數值等分，對每乙個aplha進行一次計算，最後畫出嶺跡圖。嶺跡圖的樣子如下：

到此，嶺回歸的內容就結束了，我是sklearn的小小搬運工^_^/

sklearn學習筆記之嶺回歸

sklearn之嶺回歸

sklearn嶺回歸應用

python機器學習之 sklearn 嶺回歸

sklearn學習筆記之嶺回歸

sklearn之嶺回歸

sklearn嶺回歸應用

python機器學習之 sklearn 嶺回歸

相關推薦