研究了1億條 360發現偽基站簡訊有這些規律

2021-09-23 09:33:07 字數 2881 閱讀 2220

近幾年,偽基站簡訊問題已經成為社會的頑疾,儘管備受人們關注,但始終未能從根本上杜絕。因此,加強對偽基站簡訊的研究與攔截已經成為十分緊迫的問題。

近日,360手機衛士發布了《2016中國偽基站簡訊研究報告》(以下簡稱「報告」)。雖然這只是一家網際網路公司發布的報告,但360手機衛士擁有8億的使用者,基於龐大的資料庫,完成了對偽基站簡訊的定量研究,並且從內容分類、時間特徵、地域特徵、城市特徵等多個維度對偽基站簡訊進行了系統的分析。舉例來說,僅今年3月份,360手機衛士就為全國使用者攔截各類偽基站簡訊1.1億條,平均每天攔截偽基站簡訊約354.8萬條。

筆者在研讀了這份報告後,發現其中總結了許多有趣的規律,有助於人們對偽基站簡訊做到「知己知彼」。

這份報告靠譜嗎?

先介紹下360手機衛士發布這個報告的背景。在技術層面,2023年底,360手機衛士聯合360天眼實驗室,共同研發了360新一代偽基站追蹤系統,將360手機衛士的海量實時監測資料與360天眼大資料分析技術相結合,大幅提公升了偽基站追蹤分析能力和分析效率。

而這份報告以360手機衛士2023年3月截獲的偽基站簡訊樣本為基礎,基於新一代360偽基站追蹤系統的技術分析,對全國的偽基站簡訊態勢進行了綜合分析。

移動使用者佔89.4%,因gsm最易受攻擊

從偽基站簡訊總體情況的角度看,報告中指出,2023年3月,360手機衛士共為全國使用者攔截各類偽基站簡訊1.1億條,平均每天攔截偽基站簡訊約354.8萬條。

偽基站簡訊中,冒充95555的偽基站簡訊數量最多,766萬條;其次是冒充95588、10086、95533和95599等號碼的簡訊。

非常有意思的是,在所有收到偽基站簡訊的手機使用者中,89.4%為中國移動使用者,9.5%為中國聯通使用者,近1.1%為中國電信使用者。造成這種分布不平衡的主要原因是運營商所使用的手機通訊制式有所不同,而且最容易收到偽基站簡訊的gsm(2g)系統,目前主要是中國移動仍在使用。

廣告、違法、詐騙簡訊排前三甲

從偽基站簡訊型別看,廣告推銷類簡訊數量最多,佔比高達41.3%;其次為違法資訊類簡訊33.8%;詐騙簡訊24.0%。

在所有廣告推銷類偽基站簡訊中,金融服務廣告佔到47.5%,居於首位;其次為實體店廣告(28.5%)、房地產廣告(12.9%)、電商**廣告(3.0%)、教育培訓廣告(1.1%)。

在違法類偽基站簡訊中,****類簡訊佔比最高,高達64.4%,其次是賭博資訊28.8%,**刻章類3.5%,謠言類1.1%。

在詐騙類偽基站簡訊中,身份冒充類偽基站簡訊佔到了絕大部分,佔比為93.8%,打款詐騙(1.7%)、電商**欺詐(0.7%)位列其後。

周二到周四最多,9點至19點最頻繁

從偽基站簡訊的時間特徵看,一周七天,周二到周四通常是偽基站簡訊量最多的兩天,分別佔360手機衛士一周攔截總量的16.7%、16.3%和16.3%,而周五則是偽基站簡訊量最少的一天,僅佔總攔截量的11.6%。

從一天24小時的情況來看,9點至19點為偽基站簡訊頻發時段,約佔全天總攔截量的86.0%。上午11時為一日之內的最高峰,這一小時內偽基站簡訊數量佔全天總量的8.8%。

針對一天24小時的分布分析發現,****類變化趨勢明顯不同於其他型別,它在18點以後明顯上公升,活躍時間一直到凌晨2點左右,而其他時段則幾乎為0。

河南、四川偽基站簡訊最集中

從地域來看,偽基站簡訊最為集中的省級行政區是河南、四川,比例均超過10%,其次是北京、山東、遼寧、廣東、吉林、重慶等佔比也超過5%。

對廣告推銷類偽基站簡訊分析發現,河南省的佔比為19.3%,佔據首位;而遼寧、山東分別以12.4%和12.3%位居其後。

對違法類偽基站簡訊分析發現,北京市佔比為18.3%,居首位;而河南、四川分別以14.8%和13.6%位居其後。

對詐騙類偽基站簡訊分析發現,廣東省佔比為11.5%,居首位,而上海、河南分別以9.2%和7.5%位居其後。

賭博類簡訊主要集中在四川24.7%、重慶16.6%等地,二者之和達到四成;色情類簡訊主要盤踞北京61.5%、上海21.3%,二者之和超過八成;謠言類簡訊主要分布在廣東43.5%、河南24.8%等地,二者之和將近七成;房地產推廣類簡訊中山東省的佔比27.6%,佔首位,而河南、河北分別以19.2%和11.8%位居其後,三者之和接近六成。

不同城市偽基站簡訊各不同

從城市看,偽基站簡訊最多的top10城市為北京、鄭州、成都、重慶、大連、長春、深圳、上海和瀋陽、青島。特別值得一體的是,大連和長春的偽基站簡訊攔截量排名甚至高於深圳和上海等it發達地區。

2023年3月,360手機衛士共為北京使用者攔截各類偽基站簡訊966萬條,平均每天攔截偽基站簡訊約32.2萬條。

從偽基站冒充的手機號碼的情況來看,2023年3月北京使用者收到冒充95555的偽基站簡訊59萬條,冒充10086和95588的簡訊數分別是53萬和15萬條,值得一提的是,與全國情況相比,北京市冒充號碼數出現較多的手機號碼。

從偽基站型別的角度來看,北京市偽基站簡訊最主要的型別是違法資訊類,佔比高達71.8%,詐騙(14.3%)和廣告推銷(13.8%)位列其後。這與全國其他地區的偽基站簡訊中,廣告推銷類普遍佔比最高的情況有明顯的差異。

鄭州市3月份共截獲偽基站簡訊817.3萬條;最主要的型別是違法資訊類,佔比高達56.9%,廣告推銷(26.6%)和詐騙(16.4%)位列其後。

成都市3月份偽基站簡訊總量為720.5萬條;主要是廣告推銷(45.7%)和違法資訊(42.7%)兩類,詐騙型別佔比(11.5%)明顯低於全國平均水平(22.8%)。

重慶市3月份偽基站簡訊總量為720.5萬條;各型別簡訊分布較平均,其中違法資訊(40.9%)佔比最高,其次為廣告推銷(37.1%)和詐騙(22.0%)。

大連市3月份偽基站簡訊共635.7萬條;最主要的型別是廣告推銷類,佔比高達77.7%,其次是詐騙(15.4%)和違法資訊(6.8%)。

MySQL優化 1億條資料效率COUNT

最近發現了乙個mysql快速匯入資料方法load data infile,具體參考這個文章。下面用幾條命令來給大家看看,效率結果。簡單說下 1.txt 開始只有10萬資料,後來用vim 新增到了2000萬行,用windows下的編輯器直接卡機的,windows下安裝gvim可以的。資料表型別inno...

這些基因的名字太有才了,研究一下都可以發10分文章

作為乙個人的代號,名字既可以像朱元璋一樣突顯自我,也可以像朱重八一樣只是父母年齡疊加,基因名類似。雖然在生物研究尤其是基因專案中不斷有許多新基因出現,但研究歷史可以追溯到孟德爾時期的基因直到1905年才正式有了gene的術語。為了更好的研究和描述基因的功能,基因名的確定一直為人津津樂道 一般遵從先發...

1億條以上資料,備份歷史表,並且刪除正表資料方案

背景 將正表的資料備份到歷史表裡,且刪除正表的資料 方案 1 先將要備份的資料的主鍵全部放到一張臨時表,且將臨時表加索引 2 從臨時表去查詢正表資料,然後備份該條資料到歷史表裡,然後刪除正表資料 在刪除臨時表資料 在查詢臨時表的時候,可以使用mod函式將該字段取餘,起多個執行緒去做,可以實現資料不重...