資料倉儲術語

2021-08-14 05:16:38 字數 2635 閱讀 2567

ldm:邏輯資料模型(logical data model),是利用圖形方式,通過資料和關係反映業務的乙個過程;定義需要追蹤和管理的各種重要實體、屬性和關係;是進行各種資料管理、分析和交流的重要手段;是it和業務人員溝通的橋梁。

3nf:第三正規化(3rd normal form)。所謂正規化是指資料庫設計中應該滿足的標準規範。第三正規化定義為「every non-key attribute is fully & directly functionally dependent on the candidate keys.」從定義中不難看出,這種設計方法和維度建模方法不同,能最大程度上減少冗餘,並保證結構具有足夠的靈活性和擴充套件性。

er圖:實體關係圖(entity-relationship),以圖形方式描述資料模型的一種標準方法。

subject:主題,是對資料綜合、歸類、並按一定的業務邏輯抽象出來的分析物件。

entity:實體,邏輯資料模型中的一種物件,在資料庫中的定義是「客觀存在並可相互區別的事物」,對應物理資料庫中的表(table)。

attribute:屬性,邏輯資料模型中的一種物件,在資料庫中的定義是「實體所具有的某一特性」,對應物理資料庫中的字段(field)。

key:鍵值(key attribute),唯一標識實體的屬性集。從資料上來講,乙個表中的不同記錄的key一定是不同的,key就唯一標識了某條記錄。

relationship:關係,實體之間的聯絡,反映了現實世界中事物的關聯關係和特定的業務規則。

swu:標準工作單元(standard work unit):建立能夠高效流通且不會造成瓶頸的小型模式的過程。

並行資料管理:多個機器相互協作以縮減處理時間的處理方式。

mpp:大規模並行處理(massively parallel processing),一種能夠處理海量資料的作業系統。

非結構化資料:邏輯組織形式無法被計算機理解的資料。

非易失性資料:一次寫入後不可被更改的資料,有時也叫做「快照」資料。

歸檔處理:圍繞舊資料或非活動資料展開的行為。

規範化:按照已有的標準在細節層次上組織資料的過程

合規:符合由立法機構或其他一些管理機構強制要求的業務規則。

解析:讀取文字並且查詢存在於文字中的語境化值的過程。

粒度:資料記錄的細節層次。

連線:基於乙個公共鍵來整合兩個或多個表的過程。

命名約定:在構建系統的過程中為變數賦予名稱的方式。

批處理:將事務處理分成多批一起處理。

bi:商業智慧型(business intelligence)用於將企業中現有的資料進行有效整合、快速準確的提供報表和決策依據,幫助企業做出明智業務經營決策的一套完整方法。

實體:資料的粗略分類。

資料的回流:從資料倉儲到作業環境的資料遷移。

資料概況:資料質量過程的關鍵部分,包括檢查源系統的資料是否在取值、範圍、頻率和關係等方面存在異常,以及檢查其他可能影響未來分析工作的特徵。

資料集市:資料倉儲的乙個子集,通常面向乙個業務小組或團隊。

資料模型:資料的一種抽象。

資料清洗:查詢和修正不準確資料的過程。

資料生命週期:認為資料在不同的階段呈現出不同的特徵。

資料退化:資料完整性隨時間推移不斷降低的趨向性。

mdm:主資料管理(master data management),用於建立和維護乙個一致性檢視的一系列過程,也指企業參考資料的乙個總的鍵列表。該資料報括下面這樣的實體:客戶、潛在客戶、**商、員工、產品,服務、資產和賬目等。它還包括與這些實體相關的分組和層級結構。

nlp:自然語言處理(natural language processing),認為文字的語境可以從文字本身推斷出來的思想。

自主服務bi:不需要it團隊的幫助就能使bi使用者獲取所需資訊的一種基礎設施。

ods:運算元據儲存(operational data storage),一種資料庫型別,通常用作乙個面向資料倉儲的中間區域。與包含靜態資料的資料倉儲不同,ods的內容在業務運營的過程中是不斷更新的。它還是一種資料結構,既有資料倉儲的一些特性,也有作業系統的一些特性。通常,ods是一種可選的結構,有些公司需要用到,有些則不需要。

派生實體:屬性是由其它實體的屬性計算演變而來的實體。

資料倉儲術語

資料倉儲是商業智慧型的基礎,許多基本報表可以由此生成,但它更大的用處是作為進一步分析的資料來源。所謂資料倉儲 dw 就是面向主題的 整合的 穩定的 不同時間的資料集合,用以支援經營管理中的決策制定過程。多維分析和資料探勘是最常聽到的例子,資料倉儲能供給它們所需要的 整齊一致的資料。資料探勘 dm 是...

資料倉儲專業術語

資料倉儲是商業智慧型的基礎,許多基本報表可以由此生成,但它更大的用處是作為進一步分析的資料來源。所謂資料倉儲 dw 就是面向主題的 整合的 穩定的 不同時間的資料集合,用以支援經營管理中的決策制定過程。多維分析和資料探勘是最常聽到的例子,資料倉儲能供給它們所需要的 整齊一致的資料。資料探勘 dm 是...

資料倉儲術語一覽

資料倉儲 資料倉儲是乙個支援管理決策的資料集合。資料是面向主題的 整合的 不易丟失的並且是時間變數。資料倉儲是所有操作環境和外部資料來源的快照集合。它並不需要非常精確,因為它必須在特定的時間基礎上從操作環境中提取出來。資料集市 資料倉儲只限於單個主題的區域,例如顧客 部門 地點等。資料集市在從資料倉...