手機使用者的GSP軌跡資料分析

2021-08-19 18:54:04 字數 1220 閱讀 7314

目前,手機已經成為我們生活的必需品。服務商可以很容易通過手機採集到我們日常生活的gps軌跡資料,圖1為使用者gps軌跡資料示例,其採集資料的時間間隔為5秒。直接觀察這些資料,我們只能發現使用者經過某些地點,卻不能確定使用者是否在這些地點停留過。

圖1使用者gps軌跡資料示例

那麼,如何通過分析使用者的gps資料來確定他在哪些地方停留過呢?

解決這一問題用到的演算法是cb-smot。該演算法是密度聚類的乙個改進。選擇密度聚類是因為它可以發現任意形狀的簇,這正符合使用者的活動規律。

cb-smot演算法判斷使用者在哪些地方停留過的依據有兩點,一是使用者在哪些地方的gps點相對密集,二是使用者在哪些地方的運動速度較慢。從大量點資料中尋找密集點正是密度聚類的功能所在。而cb-smot所定義的新鄰域則是尋找速度較慢的點的。

cb-smot演算法其實是dbscan聚類演算法的改進,它與dbscan的不同之處在於對鄰域的定義不同。cb-smot對鄰域定義如下:

下面通過如圖2來舉例說明新鄰域。對於o點鄰域內的點,dbscan演算法認為以o點為圓心、eps為半徑的圓內的點都在o點鄰域內,由此可知,a、b、c、d、e、f、g這八個點都在o點鄰域內;而cb-smot演算法認為,當由o點兩側相鄰的點組成的線段的長度之和小於等於eps時,這些點才在o點的鄰域內,由此可知,o點鄰域的點只包含b、c、d、e四個,這是因為bc

圖2 cb-smot的鄰域

新鄰域內相鄰的點所組成的線段的長度之和,如圖2,s=bc+co+od+de實際上就是使用者所走的路程。使用者的gps點是按照一定的時間間隔採集的。假設採集的時間間隔是5秒,由於圖2中新鄰域內共有5個點,所以此時使用者的運動時間為t=25秒。使用者在這一鄰域的速度可以表示為s/t。s最大為2eps,鄰域內的點越多,則t越大,s/t越小,說明使用者在這一區域的速度越慢,使用者可能在此處停留。

參考文獻

中國手機使用者特徵分析

2014年9月2日,魅族召開發布會,公布最新旗艦機型 mx4 對比幾個月前備受關注的錘子手機和小公尺 m4 新一代手機品牌的傳播方式已經基本成型。再過一周,蘋果最新的發布會也將到來,大屏 iphone 6 的發布已經幾乎沒有懸念。品牌概念和引數數字背後,是什麼樣的使用者在支撐起手機的品牌形象?友盟綜...

中國手機使用者特徵分析

2014年9月2日,魅族召開發布會,公布最新旗艦機型 mx4 對比幾個月前備受關注的錘子手機和小公尺 m4 新一代手機品牌的傳播方式已經基本成型。再過一周,蘋果最新的發布會也將到來,大屏 iphone 6 的發布已經幾乎沒有懸念。品牌概念和引數數字背後,是什麼樣的使用者在支撐起手機的品牌形象?友盟綜...

手機使用者對手機遊戲的偏好調查

關於 手機使用者對手機遊戲的偏好調查 成果報告 背景 目前手機上可以執行的手機遊戲可謂琳琅滿目,說那是大多數遊戲只能得到使用者一段時間的青睞,很多遊戲應用也就僅僅只有幾個月的熱度,雖然大部分手機手機遊戲最終都難逃被淘汰的命運,但是對於程式設計師來說,為了最大程度上延長應用的壽命,對於開發人員來說了解...