白話空間統計十九 熱點分析 上

2021-07-05 23:11:51 字數 2088 閱讀 4937

白話空間統計十九:熱點分析(上

) 哈羅,各位好,話說蝦神已經消失很久了,很多人在問是不是停止更新了?那肯定是不可能的,蝦神發下巨集願,要把白話空間統計寫完的。只不過這段時間遇上各種加班和一年一度的使用者大會,所以就斷掉了一段時間……

好吧,廢話不多說,進入正題。蝦神回歸寫的第一篇,就是大家期盼已久(蝦神自己期盼已久)的熱點分析了。

其實,網際網路地圖在最初經歷了瀏覽查詢和路徑導航應用以外,在空間分析上,最先讓大眾所了解的,就是類似這樣的熱力地圖了:

而且某度還直接掛了「熱力」地圖這樣的高大上的名稱,所以我們(不明真相的群眾們)自然也就把「熱點分析」當成了類似於做這種熱力圖的過程了。

而實際上,會被提出這樣乙個問題:紅色的地方,自然表示熱度大,表示人多,這個很容易理解,但是有些被標明是「冷點」的地方,真的是表示人少麼?

回答自然不是,正如上面思考的內容,如果藍色的地方,是冷點,是人少的話,那麼沒有顏色的地方呢?

所以,得出如下這一結論:

熱點分析的演算法叫做getis-ordgi* 統計(稱為

g-i-星號)。

看著是不是很眼熟啊!恭喜你,答對了,我們前面講過乙個「高

/低值聚類」,叫做getis-ord generalg,是由美國喬治敦大學麥克多諾商學院

(mcdonough school of business)

的j. keith ord和聖地牙哥州立大學地理系的arthur getis兩人提出的,而這個

gi*演算法,是這個高低值聚類演算法的高階版。

關於高/

低值聚的getis-ord generalg演算法,不記得了的同學請回頭去看白話空間統計之十四……這裡就不多說了。

那麼熱點分析是用來幹嘛的呢?

我們知道,空間統計裡面,最重要的兩個值就是p值和

z得分,所以他們首先肯定是計算p值和

z得分的了(不記得p值和

z得分是幹嘛的,請看以前的文章)。

通過得到的

z 得分和 p 值,

我們可以知道高值或低值要素在空間上發生聚類的位置。

但是這個

工具的工作方式

有些特殊:它

檢視鄰近要素環境中的每乙個要素。高值要素往往容易引起注意,但可能不是具有顯著統計學意義的熱點。要成為具有顯著統計需意義的熱點,要素應具有高值,且被其他同樣具有高值的要素所包圍。

聽到這句話,是不是又有了似曾相識的感覺了?不錯,這個解釋不就是

anselin local moran's

演算法要解決的問題麼?高的和高的蹲一起,低的和低的蹲一起,如下圖:

但是,anselin localmoran's

演算法,很容易出現下面這樣的問題:

我們可以看見,

a區域有乙個點,值高達

10000

,其他的點的值都是

3,是典型的

hl(高值被低值環繞),而

b區域都是

50,屬於標準的低值聚類,但是通過核密度(也就是所謂的熱力圖)計算,

hl區域極度的高熱……這就是前面說的,高值要素往往讓人特別的關注,但是實際上是否是具有統計學意義上的熱點呢?還是未必的。

所以,無論是在心理學裡面,還是在實際分析的過程中,都很容易出現這種問題的:

所以,從上面兩個例子,我們可以看到,在統計學的熱點分析和熱力圖這種密度分析,是完全不同的概念。那麼這個熱點分析到底是什麼東西呢?欲知後事,請聽下回分解。

白話空間統計十九 熱點分析(中)

在前面的話 白話空間統計系列還繼續更新,因為這段時間在對 使用r語言進行空間統計 系列進行翻譯翻譯和編寫,所以白話空間統計系列和使用r語言進行空間統計可能會交替出現,給大家的閱讀帶來的不便,請大家諒解 其實蝦神想說的心裡話是 你們需要的去翻蝦神的歷史文章,複習一下前面的內容吧!喔呵呵呵呵!前文再續,...

ArcGIS空間分析 熱點分析

熱帶分析對資源分配型別來說特別有用。應用領域包括 犯罪分析 流行病學 投票模式分析 經濟地理學 零售分析 交通事故分析以及人口統計學。其中的一些應用示例包括 疾病集中爆發在什麼位置?何處的廚房火災在所有住宅火災中所佔的比例超出了正常範圍?避難場所應設定在 峰值密集區出現於何處 何時?我們應在哪些位置...

白話空間統計十四 高 低值的聚類(上)

今天我們來講空間自相關的乙個高階衡量方法 高 低值的聚類。以前都說了,空間資料的關係無非就三種可能 離散 隨機 聚集,如下 那麼我們拿到資料之後,首先確定離散還是聚集,因為隨機就沒啥價值。只有確定了之後,才能絕對我們怎麼去對付他,是清蒸還是紅燒,或者是涼拌,都要看原料的。至於如何確認,我們以前也講了...