Kettle資料抽取 增量抽取

2021-05-24 05:46:39 字數 445 閱讀 9192

使用

kettle

實現資料的增量抽取的方法大致如下:

從目標表中讀取最大的時間戳或者增量字段

id,作為條件,然後把源表中所有大於這個增量欄位的資料讀出來,插入到目標表當中去;

1.開啟

kettle

工具,開啟新建的全量抽取流;

2.選擇

input,

再拖出來乙個「表輸入」控制項

開啟表輸入

2,配置相關引數,

在這裡,選擇資料庫連線,連線目標表,然後通過

select max

從目標表中找到最大的時間戳或者增量字段;傳到表輸入

源表輸入配置

開啟「表輸入」,需要關注的就是劃圈的幾個地方,從表輸入

2中插入乙個值,然後

sql條件中的?就是用這個替代的;確定就ok了

. zftang

增量資料抽取

a.觸發器 在要抽取的表上建立需要的觸發器,一般要建立插入 修改 刪除三個觸發器,每當源表中的資料發生變化,就被相應的觸發器將變化的資料寫入乙個臨時表,抽取執行緒從臨時表中抽取資料,臨時表中抽取過的資料被標記或刪除。觸發器方式的優點是資料抽取的效能較高,缺點是要求業務表建立觸發器,對業務系統有一定的...

資料抽取工具Kettle學習

kettle 是 kettle e.t.t.l.envirnonment 只取首字母的縮寫,這意味著它被設計用來幫助你實現你的ettl需要 抽取 轉換 裝入和載入資料。翻譯成中文名稱應該叫水壺,名字的起源正如該項目的主程式設計師matt 在乙個論壇裡說的哪樣 希望把各種資料放到乙個壺裡然後以一種指定...

mysql增量抽取方法 增量抽取 時間戳方式實現

時間戳方式抽取資料 介紹 它是一種基於快照比較的變化資料捕獲方式,在源表上增加乙個時間戳字段,系統中更新修改表資料的時候,同時修改時間戳字段的值。當進行資料抽取時,通過比較上次 抽取時間與時間戳字段的值來決定抽取那些資料。有的資料庫的時間戳支援自動更新,即表的其他欄位的資料發生變化時,自動更新時間戳...