kettle學習筆記 資源庫的建立

2022-08-16 12:36:12 字數 1932 閱讀 2786

kettle常見的資源庫有3種:資料庫資源庫、檔案資源庫、pentaho資源庫。

檔案資源庫是在乙個檔案目錄下定義乙個資源庫,因為kettle使用的是虛擬檔案系統(apache vfs),所以這裡的檔案目錄是乙個廣泛的概念,包括了zip檔案、web服務、ftp服務。

pentaho資源庫是乙個外掛程式(kettle企業版中有),實際是乙個內容管理系統(cms),它具備乙個理想的資源庫的所有特性,包括版本控制和依賴完整性檢查。

資料庫資源庫是把所有的etl資訊儲存在關係型資料庫中,包括資料庫連線、轉換和作業。將已開發的etl轉換、作業和相關配置儲存在資料庫資源庫中便於儲存、管理以及遠端排程。本篇文章主要介紹資料庫資源庫建立方法:

1、進入spoon,工具--資源庫--連線資源庫,點選加號+新建資源庫

2、選擇資料庫資源庫,點選確定

3、資料庫連線選擇新建,配置資料庫連線資訊,建議新建乙個空白資料庫

4、配置好資料庫連線,選擇建立或更新,繼續選擇是

5、選擇執行sql語句

6、提示執行sql錯誤,選擇確定,稍後在處理這個錯誤,對上述sql執行提示的所有錯誤全部選擇確定

7、現在連線剛剛建立的資源庫會報錯,如下

8、下面進入sql server客戶端(因為這裡使用的是sql server資料庫資源庫,根據使用的資源庫作調整),連線剛剛建立的資源庫,執行下面的sql語句

drop table  r_version;

create table r_version   

(  id_version    integer,

major_version integer,  

minor_version integer,  

upgrade_date  datetime,

is_upgrade    character (1)

insert into r_version (id_version, major_version, minor_version, upgrade_date, is_upgrade) values (1, 5, 0, '2017-02-03', 'n');

不同資料庫的sql 語句寫法可能不同,目標是讓上面標紅的sql語句成功執行

現在連線剛剛建立的資料庫資源庫會發現使用者名稱密碼錯誤,執行下面的sql語句,新增預設使用者,此時的使用者名稱密碼都是admin

insert into r_user (id_user, login, password, name, description, enabled)

values (1, 'admin', '2be98afc86aa7f2e4cb79ce71da9fa6d4', 'administrator', 'user manager', '1')

現在重新連線剛剛建立的資源庫,連線成功!

kettle的資源庫

在kettle中的轉換或者作業等資源的儲存的倉庫稱為資源庫 分為檔案資源庫 資料庫資源庫。乙個轉換或者作業可以屬於某個資源庫或者乙個單獨的檔案形態存在。一 資料庫資源庫 1.1在mysql中建立乙個資料庫作為資料庫資源庫 1.2建立資料庫資源庫工具 資源庫 連線資源庫 點選加號 選擇建立資料庫資源庫...

kettle資源庫建立整理

可以從 對話方塊,讓使用者選擇建立乙個資源庫。資源庫是用來儲存轉換任務的,它用以記錄我們的操作步驟和相關的日誌,轉換,job 等資訊。使用者通過圖形介面建立的的轉換任務可以儲存在資源庫中。資源庫可以是各種常見的資料庫,使用者通過使用者名稱 密碼來訪問資源庫中的資源,預設的使用者名稱 密碼是admin...

kettle在linux下使用檔案資源庫

用資料庫作用kettle資源庫會在資料庫中建立很多表,所以就選擇用檔案資源庫的方式。如果單純的使用檔案方式而非檔案資源庫的方式,在job引用轉換的時候要選擇檔案本地路徑,從windows移植到linux中路徑就出現問題,雖然可以手動修改一下,但是每次都修改就煩人了。使用檔案資源庫就簡單多了。當然,使...