13 資料分類模型

2021-09-01 02:44:47 字數 2525 閱讀 5535

一、資料分類模型

資料庫的型別是根據資料模型來劃分的,而任何乙個dbms也是根據資料模型有針對性地設計出來的,這就意味著必須把資料庫組織成符合dbms規定的資料模型。目前成熟地應用在資料庫系統中的資料模型有:層次模型、網狀模型和關係模型。它們之間的根本區別在於資料之間聯絡的表示方式不同(即記錄型之間的****不同)。層次模型以「樹結構」表示資料之間的聯絡。網狀模型是以「圖結構」來表示資料之間的聯絡。關係模型是用「二維表」(或稱為關係)來表示資料之間的聯絡的。

1.層次模型(hierchical)

層次模型是資料庫系統最早使用的一種模型,它的資料結構是一棵「有向樹」。根結點在最上端,層次最高,子結點在下,逐層排列。層次模型的特徵是:

有且僅有乙個結點沒有父結點,它就是根結點;

其他結點有且僅有乙個父結點。圖所示為乙個系教務管理層次資料模型,圖(a)所示的是實體之間的聯絡,圖(b)所示的是實體型之間的聯絡。

image:資料模型.jpg

最有影響的層次模型的dbs是20世紀60年代末,ibm公司推出的ims層次模型資料庫系統。

2.網狀模型(network)

網狀模型以網狀結構表示實體與實體之間的聯絡。網中的每乙個結點代表乙個記錄型別,聯絡用鏈結指標來實現。網狀模型可以表示多個從屬關係的聯絡,也可以表示資料間的交叉關係,即資料間的橫向關係與縱向關係,它是層次模型的擴充套件。網狀模型可以方便地表示各種型別的聯絡,但結構複雜,實現的演算法難以規範化。其特徵是:

允許結點有多於乙個父結點;

可以有乙個以上的結點沒有父結點。

下圖所示為乙個系教務管理網狀資料模型。

image:系教務管理層次資料模型.jpg

3.關係模型(relation)

關係模型以二維表結構來表示實體與實體之間的聯絡,它是以關係數學理論為基礎的。關係模型的資料結構是乙個「二維表框架」組成的集合。每個二維表又可稱為關係。在關係模型中,操作的物件和結果都是二維表。關係模型是目前最流行的資料庫模型。支援關係模型的資料庫管理系統稱為關聯式資料庫管理系統,access就是一種關聯式資料庫管理系統。圖所示為乙個簡單的關係模型,其中圖(a)所示為關係模式,圖(b)所示為這兩個關係模型的關係,關係名稱分別為教師關係和課程關係,每個關係均含3個元組,其主碼均為「教師編號」。

image:圖關係模型.jpg

描述的一致性,不僅用關係描述實體本身,而且也用關係描述實體之間的聯絡;

可直接表示多對多的聯絡;

關係必須是規範化的關係,即每個屬性是不可分的資料項,不許表中有表;

關係模型是建立在數學概念基礎上的,有較強的理論依據。

在關係模型中基本資料結構就是二維表,不用像層次或網狀那樣的鏈結指標。記錄之間的聯絡是通過不同關係中同名屬性來體現的。例如,要查詢「劉晉」老師所上的課程,可以先在教師關係中根據姓名找到教師編號「1984030」,然後在課程關係中找到「1984030」任課教師編號對應的課程名即可。通過上述查詢過程,同名屬性教師編號起到了連線兩個關係的紐帶作用。由此可見,關係模型中的各個關係模式不應當是孤立的,也不是隨意拼湊的一堆二維表,它必須滿足相應的要求。

關係是乙個二維表,即元組的集合。關係框架是乙個關係的屬性名錶。形式化表示為:

r(a_1,a_2,\cdot,a_n)

其中,r為關係名,ai(i=1,2,…,n)為關係的屬性名。

關係之間通過公共屬性實現聯絡。例如,圖所示為兩個關係,通過「教師編號」公共屬性實現兩個關係之間的聯絡。

關聯式資料庫是指對應於乙個關係模型的所有關係的集合。例如,在乙個教務管理關聯式資料庫中,包含教師關係、課程關係、學生關係、任課關係、成績關係等。

二、資料分類定義

元資料(metadata,reference datamaster dataenterprise structure data,transaction activity data)

引用資料(),

主資料(),

企業結構資料()

交易活動資料()

交易審計資料(transaction audit data)

元資料:資料的資料,平時我們設計表時,大部分屬性字段就是元資料。比如,性別,國籍,出生省份等。這個是最接近自然意義的的資料。

引用資料:元資料的可能取值範圍,我們設計表時所說的資料字典往往就是引用資料。比如,性別只能是男和女,男和女就是引用資料。國家的引用資料就是世界上這100多個國家和地區;

主資料:在我們資料庫設計中最重要的一些實體,是由元資料和引用資料例項的集合。dmreview 專欄作家 jane griffin 將主資料定義為「...用於為核心業務實體建立和維護全企業『記錄系統』,以記錄業務交易並評定這些實體的業績所需的資訊。」平時我們常碰到的客戶資訊,產品資訊都屬於主資料。對於主資料的介紹,我們會在後面詳細展開說明。

企業結構化資料:企業業務中所需的資料實體 ,可能是多個主資料的集合。不同行業的結構化資料會有很大不同。

交易活動資料:主資料之間活動產生的資料。比如客戶購買產品的交易記錄就是交易活動資料,工廠生產產品,生產記錄也是交易活動資料。

交易審計資料:我們對資料的所有活動都通過交易審計資料進行記錄。比如我們對客戶資訊修改的操作,對交易的增加和刪除操作,這些活動在很多關鍵系統(比如銀行)都需要記錄,以合符相應法規的要求(如 basel ii、薩班斯—奧克斯利法案)。

分類模型 資料整理

1 make classification 構造虛擬資料集,主要通過n samples,n features,n classes,weights來進行構建,後期可能會使用到n redunant和n informative等進行特徵之間相關度的分析。x,y datasets.make classifi...

資料模型分類

轉 資料模型按不同的應用層次分成三種型別 分別是概念資料模型 邏輯資料模型 物理資料模型。1 概念資料模型 conceptual data model 簡稱 概念模型 主要用來描述世界的概念化結構,它使資料庫的設計人員在設計的初始階段,擺脫計算機系統及dbms的具體技術問題,集中精力分析資料以及資料...

分類模型和回歸模型

分類 概念 對於分類問題,監督學習從資料中學習乙個分類模型或者分類決策函式,稱為分類器。分類器對新的輸入 其屬於哪一類別,稱為分類。優化過程 找到最優決策面 輸出 離散值,如0 1,yes no 評價指標 一般是精確率,即給定測試資料集,分類器能正確分類的樣本數佔總樣本數的比。模型損失函式 交叉熵損...