資料分析四 回歸分析

2022-09-07 01:21:09 字數 1033 閱讀 5361

回歸分析:統計學用來研究不確定性的基本手段;

如何研究不確定性:分析業務——找出因變數y——找出x;

x、y、 ε表示不確定性

統計學:

——(不準確)——》 統計學就是研究不確定性

回歸分析是統計學中研究資料的基本手段。

資料分析的第一步是回歸分析;

回歸分析的第一步是分析業務,第二步是確定因變數y。

回歸分析:把抽象的業務問題具體化為資料可分析問題(清晰的資料問題)。 

因變數 y 是什麼:首先,確定 y。

首先,確定 y(業務問題轉為資料問題):

比如,什麼是航線執行效率:單公里航線,單座,客流量;

什麼是卡車司機駕駛習慣:違章次數,卡車油費;

什麼是客戶價值:未來的收入高低(如客戶花同樣的錢在保險和豪車上的收入區別);

可能的待選因素x是什麼:

比如,航線執行效率: 時間,始發站和終點站等;

卡車司機駕駛習慣:駕駛經驗,路線等;

客戶價值:客戶性別,年齡,職業等;

可控型與不可控型x變數;

空間統計(四)回歸分析探索

而 空間關係建模 工具箱中的工具,更傾向於研究 why?例如,為什麼會出現這種情況?或者說什麼導致了這種情況。這時我們就可以使用工具進行回歸分析,如 普通最小二成法 ols 和 地理加權回歸 gwr 你可能會問,為什麼要進行回歸分析?幫助文件中回歸分析基礎這一章寫的最好,比較貼近讀者,而不是冰冷的字...

機器學習(2) 回歸演算法 回歸分析

在統計學中,回歸分析 regression analysis 指的是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。回歸分析按照涉及的變數的多少,分為一元回歸和多元回歸分析 按照因變數的多少,可分為 簡單回歸 分析和多重回歸分析 按照 自變數和 因變數之間的關係型別,可分為 線性回歸 ...

(機器學習筆記一)回歸分析

訓練集 x 表示輸入值 y 表示輸出值 i 表示訓練集中的樣本索引。學習結果 函式 h x y 使得 h x 能夠很好的 y 由於歷史原因 h被稱作假設 hypothesis 如果目標變數是連續的值,我們稱這個學習問題是乙個回歸問題。如果目標變數是很少的幾個離散的值,我們稱它為分類問題。形如關於 x...