ETL工具Talend最佳實踐

2022-08-29 07:45:09 字數 890 閱讀 9522

前言和talend這款軟體打交道有一段時間了,主要用它來做一些etl相關的作業開發,以下總結了一些自己配置與開發過程中的最佳實踐。

最佳實踐

可以通過修改talend studio 的.ini配置檔案來給其分配更多的記憶體,例如,以下是我在64位8gb記憶體的電腦配置的引數

-vmargs

-xms2014m

-xmx4096m

-xx:maxpermsize=512m

-dfile.encoding=utf-8

在開發過程中一定要注意對null值得處理

可以建立repository metadata用於資料庫連線

可以使用 t 的資料連線元件定義資料庫連線,並重複使用。

記得使用 t 元件來關閉資料庫連線

避免在talend的元件中在使用硬編碼值(hard coding),使用talend context 變數代替

盡可能使用變數代替硬編碼

對於頻繁的變換,可以通過建立routines或者functions來減少工作量

每次關機前記得儲存並關閉talend studio!!!

盡可能早的使用tfiltercolumns元件過濾去不需要的字段/列

盡可能早的使用tfilterrows元件過濾去不需要的資料

使用select列表示式從資料庫獲取資料,盡量避免獲取不需要的字段

當作業出現oom錯誤時,調整jvm的引數,例如修改xms和xmx來分配更多的記憶體

通過使用並行化選項來提高作業效能,減少整體的執行時間,如並行化從資料讀寫資料等

給main job起乙個有意義的名字

在定義sub job時,務必第一時間記錄子作業的標題、描述和目的。

在設計作業盡可能將複雜的作業切割成乙個個小作業

最佳實踐 Flutter 最佳實踐

最佳實踐是乙個領域可以接受的專業標準,對於任何程式語言來說,提高 質量 可讀性 可維護性和健壯性都非常重要。讓我們探索一些設計和開發flutter應用程式的最佳實踐。class enum typedef和extension應採用駝峰命名uppercamelcase規則。class mainscree...

ETL工具選型參考

目前主流的etl工具有kettle talend nifi datastage informatica cogons ssis等,其中nifi kettle和talend是開源軟體,其他均為商業軟體。開源軟體本身是不收費的,所以主要成本在培訓和諮詢方面,成本會維持在乙個相對較低的水平。商業軟體本身收...

JUnit最佳實踐

junit最佳實踐 cherami 轉貼 參與分 20053,專家分 4960 發表 2003 9 16 下午7 57 版本 1.0 閱讀 3899次 martin fowler說過 當你試圖列印輸出一些資訊或除錯乙個表示式時,寫一些測試 來替代那些傳統的方法。一開始,你會發現你總是要建立一些新的f...