sqoop操作與使用

2022-05-06 05:48:10 字數 1596 閱讀 6459

sqoop只要安裝到集群中的一台節點就可以了

1.上傳sqoop到節點中

2.安裝和配置

在新增sqoop到環境變數到/etc/profile中

將資料庫連線驅動拷貝到$sqoop_home/lib裡

3.使用

第一類:資料庫中的資料匯入到hdfs上

sqoop import --connect jdbc:mysql: --username root --password 123  --table trade_detail --columns 'id, account, income, expenses'

--username 資料庫使用者名稱

--password 密碼

--table 要連線的資料表

--colunms 指定表中的列,要用引號

sqoop import --connect jdbc:mysql: --username root --password 123  --table trade_detail --target-dir '/sqoop/td' --fields-terminated-by '\t'

--target-dir 指定輸出路徑

--fields-terminated-by 以指定的符號作為字段之間的分隔符

sqoop import --connect jdbc:mysql: --username root --password 123  --table trade_detail --target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2

-m 2 指定啟用幾個map任務

sqoop import --connect jdbc:mysql: --username root --password 123  --table trade_detail --where 'id>3' --target-dir '/sqoop/td2' 

--where 增加where條件, 注意:條件必須用引號引起來

sqoop import --connect jdbc:mysql: --username root --password 123 \

--query 'select * from trade_detail where id > 2 and $conditions' --split-by trade_detail.id --target-dir '/sqoop/td3'

--query 增加sql語句(使用 \ 將語句換行)

注意:如果使用--query這個命令的時候,需要注意的是where後面的引數,and $conditions這個引數必須加上

而且存在單引號與雙引號的區別,如果--query後面使用的是雙引號,那麼需要在$conditions前加上\即\$conditions

如果設定map數量為1個時即-m 1,不用加上--split-by $,否則需要加上

第二類:將hdfs上的資料匯出到資料庫中(不要忘記指定分隔符)

sqoop export --connect jdbc:mysql: --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ','

sqoop 安裝與使用

sqoop安裝 安裝在一台節點上就可以了。1.上傳sqoop 2.安裝和配置 在新增sqoop到環境變數 將資料庫連線驅動拷貝到 sqoop home lib裡 3.使用 第一類 資料庫中的資料匯入到hdfs上 sqoop import connect jdbc mysql username roo...

Sqoop安裝與使用

使用sqoop進行將hive 詞頻統計的結果資料傳輸到mysql中。mysql準備接受資料的資料庫與表 hive準備待傳輸的資料 sqoop進行資料傳輸 mysql檢視傳輸結果 先用測試檔案做實驗,成功後將電子書的統計結果傳輸出mysql中。一.測試檔案 1.mysql準備接受資料的資料庫與表 2....

Sqoop安裝與使用

使用sqoop進行將hive 詞頻統計的結果資料傳輸到mysql中。mysql準備接受資料的資料庫與表 hive準備待傳輸的資料 sqoop進行資料傳輸 mysql檢視傳輸結果 先用測試檔案做實驗,成功後將電子書的統計結果傳輸出mysql中。一.測試檔案 1.mysql準備接受資料的資料庫與表 2....