空間資料的採掘

2021-04-08 23:43:43 字數 2016 閱讀 9238

近年來,資料採掘研究多針對於關聯式資料庫,但是空間資料庫系統的發展為我們提供了豐富的空間資料,為資料分析和知識發現展示了廣闊的前景。空間資料探勘技術幫助人們從龐大的空間資料中抽取有用資訊。由於空間資料的數量龐大及空間問題的特殊性,因此發現隱含在空間資料中的特徵和模式,已成為空間資料庫的乙個重要問題。現已在gis 系統、影象資料庫等領域得到了廣泛應用。

空間資料採掘的方法包括:

1.歸納方法

基於歸納方法的空間資料採掘演算法必須由使用者預先給定或系統自動生成概念層次樹 ,發現的知識依賴於層次樹結構,計算複雜性為o(logn),n為空間資料個數。

2.聚集方法

基於聚集方法的空間資料探勘演算法包括clarans、birch、dbscan等演算法。

3.統計資訊網格演算法(sting)

該方法是乙個查詢無關演算法,每個節點儲存資料的統計資訊,可處理大量的查詢。演算法採用增量修改,避免資料更新造成的所有單元重新計算,而且易於並行化。

4. 空間聚集和特徵鄰近關係採掘

(1)發現集合鄰近關係:給定乙個點的聚集,找到聚集的k個最鄰近特徵。crh演算法尋找集合鄰近關係,它是circle、isothetic rectangle和convex hull的首字母縮寫形式。c rh用篩選器逐步減少特徵個數,直至找到k個最接近特徵。在sparc-10工作站上的實驗結果表明,crh作為一種近似演算法,得出的結果相當精確,它能在約1秒cpu時間內從5000個特徵中找到最近的25個。

(2)發現集合鄰近的共性:給定n個聚集,找到與全部或大多數聚集最接近的公共特徵類,即出現在同一分類中的相似特徵,例如發現所有居民區都與中學相近,而不一定是同一所中學。gencom 演算法從n個聚集的n個最近k個特徵的集合中抽取集合鄰近公共特徵。

資料採掘的工具

目前,國外有許多研究機構、公司和學術組織從事資料採掘工具的研製和開發。這些工具主要採用基於人工智慧的技術,包括決策樹、規則歸納、神經元網路、視覺化、模糊建模、簇聚等,另外也採用了傳統的統計方法。這些資料採掘工具差別很大,不僅體現在關鍵技術上,還體現在執行平台、資料訪問、**等方面。

資料採掘工具可根據應用領域分為三類:

(1)通用單任務類:僅支援kdd的資料採掘步驟,並且需要大量的預處理和善後處理工作。主要採用決策樹、神經網路、基於例子和規則的方法,發現任務大多屬於分類範疇。

(2)通用多工類:可執行多個領域的知識發現任務,整合了分類、視覺化、聚集、概括等多種策略,如clementine、ibm intelligent miner、sgi mineset。

(3)專用領域類:現有的許多資料採掘系統是專為特定目的開發的,用於專用領域的知識發現,對採掘的資料庫有語義要求,發現的知識也較單一。如explora用於超市銷售分析 ,僅能處理特定形式的資料,知識發現也以關聯規則和趨勢分析為主。另外發現方法單一 ,有些系統雖然能發現多種形式的知識,但基本上以機器學習、統計分析為主,計算量大。

根據所採用的技術,採掘工具大致分為六類:

(1)基於規則和決策樹的工具:大部分資料採掘工具採用規則發現和決策樹分類技術來發現資料模式和規則,其核心是某種歸納演算法,如id3和c4.5。它通常先對資料庫中的資料進行採掘,生成規則和決策樹,然後對新資料進行分析和**,典型產品有angoss sof tware開發的knowlege seeker和attar software開發的xpertrule profiler。

(2)基於神經元網路的工具:基於神經元網路的工具由於具有對非線性資料的快速建模能力,因此越來越流行。挖掘過程基本上是將資料簇聚,然後分類計算權值。它在市場資料庫的分析和建模方面應用廣泛,典型產品有advanced software 開發的pbprofile。

(3)資料視覺化方法:這類工具大大擴充套件了傳統商業圖形的能力,支援多維資料的視覺化,同時提供了多方向同時進行資料分析的圖形方法。(4)模糊發現方法:應用模糊邏輯進行資料查詢排序。

(5)統計方法:這些工具沒有使用人工智慧技術,因此更適於分析現有資訊,而不是從原始資料中發現資料模式和規則。

(6)綜合多方法:許多任務具採用了多種挖掘方法,一般規模較大。

工具系統的總體發展趨勢是,使資料採掘技術進一步為使用者所接受和使用,另一方面也可以理解成以使用者的語言表達知識概念。

Sql Server 空間資料

1 地理座標系空間需要用geography 平面座標系空間用geometry,計算距離使用stdistance 字串裡經緯度的順序是 經度 空格 緯度 即 longitude latitude 如果要計算兩個lat lon點之間的實際距離就需要將geometry型別轉成geography型別,不然結...

基於空間資料庫的空間資料管理

gis空間資料管理已經走出了檔案管理的模式 龔健雅,2004 最初的gis 軟體一般採用檔案方法管理向量圖形資料,利用關聯式資料庫管理系統管理屬性資料。目前主要的gis軟體都採用了商用關聯式資料庫管理系統同時管理圖形和屬性資料。如supermap mapgis geostar arcgis geom...

空間資料轉換引擎

引擎採用windows com方式開發,二次開發者可以直接使用所提供的元件進行二次開發。支援第三方嵌入開發 第三方根據引擎提供介面,實現其特定格式檔案轉換,編譯成動態庫後可直接嵌入引擎內部,實現無縫連線。軟體實現的功能是支援以下格式空間資料格式相互轉換 arc view shape 檔案 arc i...