白話空間統計二十四 地理加權回歸(一)

2021-07-27 17:00:36 字數 1636 閱讀 9791

二十四在人的生活中有舉足輕重的地位,一年有二十四個節氣,一天有二十四個小時。中國的正史稱之為「二十四史」(有人說加清史就二十五了……但是正史這個詞,出自清乾隆欽定二十四史,所以一直「正史」這個詞,專指二十四史),白話空間統計寫到現在,歷時18個月,終於寫到這個一元復始的二十四章了。

地理加權的回歸分析是空間統計裡面乙個重要關口……如果說莫蘭指數作為空間統計的入門門檻,p值z得分是空間統計第乙個攔路虎,那麼地理加權回歸分析,就應該是飛公升的天劫了……渡得過去,就霞舉飛公升,天地同壽……渡不過去,就魂飛魄散……額,也沒那麼恐怖,過不去就過不去了,大不了我不當神仙了就是。

上一節說到,當資料缺失的時候,可以通過回歸方程進行補全,通過兩個資料示例我們發現,全域性的回歸方程會出現各種問題,而區域性的回歸,效果往往更好。說到這裡的時候,我們來看下面的資料:

山東省分市區的人口與財政收入資料(2023年,資料**山東省統計資訊網),中國有句老話,叫做「人多力量大」,當然,也有個別想當一秒鐘英雄的不甚認同這句話,比如下面:

但是一般來說,在我們的印象中,人口的多少與財政收入也往往是正相關的。

那麼我們首先來進行一下全域性的一元回歸,看看結果:

以前漏掉回歸概念的科普:r-squared,也就是判定係數,這個係數在0-1之間,越接近1,表示這回歸模型的效果越好,比如判定係數為1的話,就表示模型中的自變數能夠100%的解釋因變數的變化……類推,上面的0.04,就表示在這個模型裡面,自變數只能解釋4%的因變數的變化……換句話說,這兩個東東基本上就沒有啥關係嘛。

但是,我抽取乙個市的資料,比如威海,然後再計算一下,如下所示:

這一刻,我的心情是:

如果說,這是蝦神刻意提出來的一些資料,還情有可原……但是這不是乙個完整的市麼?肯定是幻覺……我們來換乙個城市……嗯,就換成蝦神最喜歡的格陵蘭——greenland……當然,你叫它青島也行……

當乙個資料,在a區域內有很強的解釋能力,比如在威海市,人口數量對財政收入的變化,可解釋性超過了96%,但是同樣居於魯東的青島,只有1%,簡直就不能用不顯著來形容。這種在不同區域具有不同性質的情況,就是在空間分析裡面無所不在的空間異質性了……

如何能夠避免這個問題呢?那麼地理加權的回歸分析,就是為了對這個問題進行修正而生。

正如蝦神所言:

天若不生gwr,萬古回歸如長夜……

至於這個神器如何使用,如何解讀,我們下回分解……

白話空間統計二十四 地理加權回歸(四)

本來這一章準備直接寫 照抄 arcgis的幫助文件,寫地理加權回歸工具的使用 然後就直接結束地理加權回歸的,但是近來收到不少同學的郵件,很多都是掉在了當年蝦神挖出的大坑裡面,比如寫了方法,沒有列出公式,又比如寫了公式木有推導過程 作為高數戰五渣的蝦神,推導這種事,他認識我,我不認識他 所以這次寫gw...

C 回顧學習筆記二十四 命名空間

從我們開啟vs軟體,開啟控制台程式並開始寫 時,命名空間就開始在發揮作用了。在 的最上方可以看到很多using語句,那就是引用了命名空間。引用命名空間的格式是 using 命名空間名字 這樣就可以在程式中直接用命名空間的型別,而不必指定型別的詳細命名空間。using system 通常都會出現在.c...

白話空間統計二十 相似性搜尋(三)

昨天簡單的寫了寫相似性搜尋的主要方法,這些方法對於學 gis的同學來說,實在是太簡單了,所以很多同學反應 蝦神泥垢了!科普也要有點深度可好,你是在湊字數麼!好吧,我覺得上篇文章是有點點問題 我們要向前看,反正已經發出去了,這篇文章就扔那裡吧,作為存檔用。今天繼續寫相似性搜尋,昨天說了 6種方法,簡單...