ETL架構師面試題

2021-07-23 13:14:55 字數 1274 閱讀 3733

本部分的題目來自

kimball

的etl toolkit分析1

.什麼是邏輯資料對映?它對

etl專案組的作用是什麼?

2.在資料倉儲專案中,資料探索階段的主要目的是什麼?

3.如何確定起始**資料?

架構4.

在etl

過程中四個基本的過程分別是什麼?5.

在資料準備區中允許使用的資料結構有哪些?各有什麼優缺點?

6.簡述

etl過程中哪個步驟應該出於安全的考慮將資料寫到磁碟上?

抽取7.

簡述異構資料來源中的資料抽取技術。

8.從erp源系統中抽取資料最好的方法是什麼?

9.簡述直接連線資料庫和使用

odbc

連線資料庫進行通訊的優缺點。

10.簡述出三種變化資料捕獲技術及其優缺點。

資料質量11.

資料質量檢查的四大類是什麼?為每類提供一種實現技術。

12.簡述應該在

etl的哪個步驟來實現概況分析?

13.etl

專案中的資料質量部分核心的交付物有那些?

14.如何來量化資料倉儲中的資料質量?

建立對映15.

什麼是**鍵?簡述**鍵替換管道如何工作。

16.為什麼在

etl的過程中需要對日期進行特殊處理?

17.簡述對一致性維度的三種基本的交付步驟。

18.簡述三種基本事實表,並說明

etl的過程中如何處理它們。

19.簡述橋接表是如何將維度表和事實表進行關聯的?

20.遲到的資料對事實表和維度表有什麼影響?怎樣來處理這個問題?

元資料21

.舉例說明各種

etl過程中的元資料。

22.簡述獲取操作型元資料的方法。

23.簡述共享業務元資料和技術元資料的方法。

優化/操作

24.簡述資料倉儲中的表的基本型別,以及為了保證引用完整性該以什麼樣的順序對它們進行載入。

25.簡述

etl技術支援工作的四個級別的特點。

26.如果

etl程序執行較慢,需要分哪幾步去找到

etl系統的瓶頸問題。

27.簡述如何評估大型

etl資料載入時間。

實時etl

28.簡述在架構實時

etl時的可以選擇的架構部件。

29.簡述幾種不同的實時

etl實現方法以及它們的適用範圍。

30.簡述實時

etl的一些難點及其實現方法。

ETL架構師面試題(四)

資料質量 一 資料質量檢查的四大類是什麼?為每類提供一種實現技術。資料質量檢查是etl工作中非常重要的一步,主要關注以下四個方面。1 正確性檢查 corret 檢查資料值及其描述是否真實的反映了客觀事務。例如位址的描述是否完全。2 明確性檢查 unambiguous 檢查資料值及其描述是否只有乙個意...

etl工程師 面試題 面試ETL題總匯

etl 面試題總匯 一 分析 什麼是邏輯資料對映?它對 etl專案組的作用是什麼?答 邏輯資料對映 logical data map 用來描述源系統的資料定義 目標資料倉儲的模型以及 將源系統的資料轉換到資料倉儲中需要做操作和處理方式的說明文件,通常以 或 excel 的格式儲存如下的資訊 目標表名...

怎麼面試架構師

其實本文想說的是 當面試乙個架構師的時候,我們應該問什麼問題?我覺得,問什麼樣的問題,體現了team leader更加看重架構師的哪些特點。我一直認為,做技術就跟練武一樣,在練武的不同階段,分招式和心法。技術也一樣,在不同的階段,也分招式和心法。另外,就我個人而言,經常忘記招式,一方面可以說十二年來...