元資料的由來與定義

2021-04-28 14:31:15 字數 2115 閱讀 2549

存在很多關於元資料與

xml之間的關係的似是而非的認識,這裡談談我的看法。

自然數集合是公理性認識,數總是與運算相聯絡的,即所謂的數與運算的不可分性。

所謂運算的完美性,就是數學的純粹性,即數學研究當中可以不計較其應用特徵,而僅僅追求數學的內在的規律性。

運算的完美性,擴大了數的範疇。如加法運算的逆運算,減法。當加法、減法完全可逆以後,數的範疇就從自然數擴大到整數域了。同樣的,乘法與除法完全可逆之後,數的範疇就從整數擴大到有理數了;指數與對數運算完全可逆之後,又把數的範疇從有理數擴大有無理數和複數範疇裡了。

當數與運算發展到一定高度以後,人們追求運算的機械化、自動化,從而誕生了圖靈機系統。圖靈機系統可以定義如下: 1

)有乙個確定的數域。 2

)以及基於該數域的一組確定的運算,稱該組運算為乙個圖靈機。運算通常由硬體來實現,也可以用軟體來模擬。此時稱這些運算為指令集或

者功能函式集。 3

)圖靈機系統定義為該組運算的生成,該組運算的乙個生成就是乙個圖靈機系統,也稱圖靈機系統為演算法,該組運算的生成空間就是該圖靈機的算

法空間。

當研究算

法理論的時候,不能不提到布林代數。布林代數是通用圖靈機研究的必然,通用圖靈機不是人們通常所認為的乙個具有通用運算指令集合的計算機系統。事實

上,pc

機只是具有常用運算指令集合的計算系統,這個「常用

」是基於人們對於運算需求而做出的使用頻度的乙個度量,「常用

」不是「通用

」。世上根本不存在什麼「通用

」的東西。因此通用運算集合是不存在的,通用計算系統也是沒有的。

具有乙個運算集合的計算機就是乙個圖靈機,運算集合的乙個生成就是乙個圖靈機系統,通用圖靈機研究的是所有圖靈機系統所具有的共同特徵。因此通用圖靈機研究的是運算生成理論,即圖靈機系統理論,也即演算法理論。

在引入了布林代數以後,通用圖靈機可以匯出軟體程式理論模型,即我們通常所說的程式設計的

3大結構:順序、分支和迴圈

當圖靈機理論、即演算法理論與軟體實踐發展到達一定高度了的時候,人們產生了軟體模組復用的需求。乙個軟體模組就是乙個圖靈機系統,這個復用包括了

2個方面的

涵義:

1)靜態復用:整個模組當成乙個更高階系統的原子模組來復用。這是軟體理論與實踐的早期追求。 2

)動態復用:軟體模組作為「服務

」來動態生成乙個更

加高階的複雜系統。這裡的「服務

」具有社會學意義,即服務的社會性,服務就是社會服務。這正是我們當前計算系統理論與技術實踐所面臨的情況。

此時就需要引入元資料的概念了。

在軟體動態復用、也即

「軟體即服務

」的實踐過程中,我們需要對乙個具體軟體模組的行為抽象,這個抽象實踐就是軟體工程裡的

handle

,通常翻譯為控制代碼,而描述該控制代碼的技術就是元資料。元資料的表達可以是任意形式,

xml是其中一種適合的表達技術。

根據handle

所定義的圖靈機模組內涵的不同元資料可以有不同的表現形式。當軟體模組僅包含有函式而無內部變數時,軟體實踐就是早期面向過程的程式設計模型;

當模組裡只有變數而無函式時,軟體實現就是管理系統,有人稱此時的元資料定義為資料的資料;當模組裡包含變數和函式

2者時,其實踐過程就是著名的物件導向

程式設計了。

元資料與

xml的關係可以用文字與紙張的關係來模擬。

人們發明出紙張的目的就是為了記載文字的需要的,但文字不侷限於記載在紙張上面,雖然文字適合於記載在紙張上。文字還可以記載在石頭(稱為石刻)、木頭(稱為木雕)上,甚至是金屬上面。同樣,現代紙張早已不侷限於僅僅用來記錄文字了,手紙就是用來擦拭而非記錄的。

同樣的,元資料適合於用

xml來表達,但絕對不能狹義地理解為只能用

xml來表達元資料的,早期的控制代碼顯然不是用

xml來描述的,因為那時候

xml還沒有被發明出來呢,正如同早期的文字記載還沒有發明紙張一樣。

xml是一種資料表達和描述格式,適合於在不同的計算機系統間流轉和共享,但

xml除了描述和表達元資料以外,還可以表達其他需要在系統間流轉和共享的任何資料。

資料治理 元資料 定義

基本定義 舉例說明 如果僅僅看上面的這個定義可能還不能理解,那我們舉個例子。在乙個儲存客戶資訊的表中定義了性別字段,其資料型別是varchar,取值範圍一般也就有如下幾種 male female null,三種也就是分別代表男 女 未知。那我們在向這個客戶表中維護客戶資訊時,性別欄位也就只能有mal...

Normal Equations 的由來與推導

假設我們有m個樣本。特徵向量的維度為n。因此,可知樣本為,其中對於每乙個樣本中的x i 都有x i 令 h 0 1x 1 2x 2 nx n,則有 這個很好示意,但是維度標記錯誤了。x 是 m n 1 維,包含 0為 n 1 1 維。若希望h y,則有 x y 我們先來回憶一下兩個概念 單位矩陣 和...

元資料的定義和管理

來自 資料倉儲結構設計與實施 建造資訊系統的金字塔 源 系統 資料定於與說明 以上資訊都是有可能要變化的,應作為元資料存入資料表,etl程式和處理過程可以讀入這些資訊,以進行遠端資料鏈結和資料訪問,這大大優化將以上資訊寫入程式中的那種硬性程式設計方式 暫存定義與說明 目標模型定義與說明 映像定義與說...