Sqoop簡介與原理

2021-10-06 05:35:27 字數 397 閱讀 7807

apache sqoop™是一種旨在有效地在apache hadoop和諸如關聯式資料庫等結構化資料儲存之間傳輸大量資料的工具。

sqoop於2023年3月孵化出來,現在是乙個頂級的apache專案。

請注意,1.99.7與1.4.6不相容,且沒有特徵不完整,它並不打算用於生產部署。

將匯入或匯出命令翻譯成mapreduce程式來實現。

在翻譯出的mapreduce中主要是對inputformat和outputformat進行定製。

1.區別

(1)flume資料採集 採集日誌資料

(2)sqoop資料遷移 hdfs->mysql

(3)azkaban任務排程 flume->hdfs->shell->hive->sql->bi

2.sqoop作用:

大資料 Sqoop簡介

sqoop 發音 skup 是sql to hadoop的縮寫,是一款開源的工具,主要用來在hadoop和關係資料之間交換資料,可以改進資料的資料的互操作性。通過sqoop,可以方便地將資料從mysql oracle postgresql等關聯式資料庫中匯入hadoop 比如匯入到hdfs hbas...

sqoop的安裝和原理

sqoop 是一款資料遷移的工具,可以從 mysql等資料庫遷移到 hdfs 裡面 依賴 yarn 和 hdfs,如果伺服器上面有 hadoop home這個變數,sqoop會自動去讀取這個值來尋找yarn和namenode,安裝在一台節點機上面就可以了安裝 tar xvf sqoop 1.4.4....

puppet初識與原理簡介

初識 puppet是一種linux unix windows平台的集中配置管理系統,使用自有的puppet描述語言,可管理配置檔案 使用者 cron任務 軟體包 系統服務等。puppet把這些系統實體稱之為資源,puppet的設計目標是簡化對這些資源的管理以及妥善處理資源間的依賴關係。puppet工...