sqoop企業實戰教程

2021-10-09 16:19:33 字數 576 閱讀 4598

針對不同的資料來源之間進行資料同步。

1、關係型資料庫中資料怎麼匯入到hdfs、hbase(壓縮或者非壓縮)?

2、hdfs中的資料(壓縮)怎麼匯入關係型資料庫中?

3、增量資料匯入?

sqoop是乙個hadoop和關係型資料庫之間高效批量資料同步工具。

匯入:

關係型資料庫 -----> hadoop(hdfs\hive\hbase...)

匯出:hadoop(hdfs) ----> 關係型資料庫

優點:跨平台資料同步

缺點:不是很靈活。

4.1 前提

1 hadoop的安裝參考位址

2 需要jdk

3 需要準備關係型資料庫的依賴jar包

4.2 安裝

1.解壓配置環境變數

[root@hadoop01 local]

# tar -zxvf /home/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -c /usr/lo

企業實戰 企業FTP搭建

提前關閉selinux 和firewalld防火牆 1.安裝vsftp軟體包 yum y install vsftpd 2.啟動vsftpd伺服器 systemctl restart vsftpd systemctl enable vsftpd 3.檢查服務是否正常啟動 ps ef grep vsf...

Linux Redis實戰教程

1 linux 1.1 linux介紹 包括linux和windows的區別,linux歷史及使用場景,linux版本介紹 1.2 linux安裝 包括虛擬機器軟體介紹及安裝,linux安裝配置,linux目錄介紹,crt遠端連線linux 1.3 常用命令 命令分類如下 磁碟管理命令,檔案瀏覽命令...

Mahout實戰教程

課程大綱 第一周mahout概述 mahout安裝 mahout安裝測試 mahout演算法庫介紹 解析聚類演算法 解析分類演算法 協同過濾演算法 第二週聚類演算法詳解 一 canopy演算法簡介 1 mahout中canopy演算法實現原理 2 mahout的canopy演算法實戰 3 hadoo...