資料倉儲 學習記錄(1)

2022-07-25 07:45:12 字數 1142 閱讀 2640

1. 資料的抽取

1.1 從資料庫中抽取資料生成本地檔案

1.1.1 將「資料流任務」控制項拖入「控制流」視窗

1.1.2 選擇資料來源

1.1.2.1 將「「ole db 源」」拖入「資料流」視窗,雙擊編輯屬性

1.1.2.2 新建「連線管理器」,輸入資料庫名稱,選擇連線方式,選擇資料庫名,嘗試連線成功即可確定

1.1.2.3 在「使用表或檢視」項選擇要抽取的表,確定完成資料來源配置

1.2.3 選擇檔案目標

1.2.3.1 將「平面檔案目標」拖入「資料流」視窗,將「ole db 源」綠色箭頭指向「平面檔案目標」,雙擊編輯屬性

1.2.3.2 新建「連線管理器」,選擇帶分隔符(生成的檔案為單列以分隔符分隔屬性的檔案),輸入名稱,在「檔名」項選擇瀏覽選中需要匯出的csv檔案

1.2.3.3 在「列」的「列分隔符」中指定符號(使用復合符號可以防止對資料的破壞)將資料項合併成一列

1.2.4 右鍵「資料流任務」選擇「執行任務」,完成資料的抽取

1.2 從csv檔案抽取資料到資料庫

1.2.1 將「資料流任務」控制項拖入「控制流」視窗

1.2.2 選擇資料來源

1.2.2.1 將「「平面檔案源」」拖入「資料流」視窗,雙擊編輯屬性

1.2.2.2 新建「連線管理器」,輸入名稱,在「檔名」項選擇瀏覽選中需要匯入的csv檔案

1.2.2.3 在「列」的「列分隔符」中指定符號將資料項區別開

1.2.2.4 確定後,在「平面檔案連線管理器」中「列」項選中所有列,完成資料來源配置

1.2.3 選擇目標資料庫

1.2.3.1 將「sql server 目標」拖入「資料流」視窗,將「平面檔案源」綠色箭頭指向「sql server 目標」,雙擊編輯屬性

1.2.3.2 新建「連線管理器」,輸入資料庫名稱,選擇連線方式,選擇資料庫名,嘗試連線成功即可確定

1.2.3.3 在「使用表或檢視」項選擇「新建」,自動生成sql指令碼,確定即可在指定資料庫生成匹配的表結構,確定完成配置

1.2.4 右鍵「資料流任務」選擇「執行任務」,完成資料的抽取

常見錯誤:

1.截斷錯誤:即相應屬性大小超出了型別範圍,修正即在「連線管理器」的「高階」中修改屬性的大小

2.連線表出錯:可能是sql不支援中文,或者「對映」裡沒有對應對映

資料倉儲 大資料學習 記錄 筆記

名詞解釋 1 scd slow changing dimension緩慢變化維度 能告訴我scd哪三種型別嗎?第一種 覆蓋原記錄,只保留最新記錄 第二種 對每一種變化 update 都記錄,主鍵預留一部分 powercenter好像是預留1000個 第三種 折中 保留上次的記錄 2 ods 運算元據...

資料倉儲學習

3.資料倉儲的設計始於資料模型。企業資料模型用於操作型環境的設計。企業資料模型的 一種變型用於資料倉儲的設計。資料倉儲以反覆開發的形式建立。對於資料倉儲的需求是不 可能預先知道的。資料倉儲的構造是在與傳統操作型系統完全不同的開發生命週期中進行的。資料倉儲開發者面臨的基本問題是管理大量資料。為此,資料...

資料倉儲學習

資料倉儲 第二章 資料倉儲環境 1 1.1資料倉儲的特性介紹 資料倉儲是乙個面向主題的,整合的,非易失的,隨時間變化的用來支援管理人員決策的資料集合。面向主題 對於乙個保險公司,公司的主題域可能是顧客 保險單 保險費 與索賠。而對於乙個生產商,主題域可能是產品 訂單 銷售商 材料單與原貨物等。不同型...