從mysql抽取資料到hive遇到的問題

2021-08-30 17:39:19 字數 375 閱讀 7784

資料遷移最大的影響是資料型別的不同導致資料不匹配,比如文字mysql中為text,到了hive就變成string,hive中int型別的都不帶長度

重點是時間型別的轉換

mysql中datetime型別的資料是這樣的, hive中需要用timestamp來進行轉換

mysql中date型別hive中也用date型別來匹配資料型別,

作者在hive中用timestamp匹配資料,結果變成了null,外部表還好能夠alter欄位型別就能匹配回來

alter table 表名 change column 列名 列名 型別;

Flume抽取mysql資料到hive

1.2.環境配置 hive根目錄 opt cloudera parcels cdh 6.0.0 1.cdh6.0.0.p0.537114 lib hive hcatalog share hcatalog 中的4個jar包匯入flume home lib hive hcatalog core 2.3....

SQOOP從MySQL匯入資料到Hive

一 匯入hive表時自動建立表 1 執行sqoop語句 sqoop import connect jdbc mysql hadoop001 3306 sqoop username root password 123456 table emp etl m 1 hive import create hi...

sqoop定時增量抽取資料到hive

1 第一次全量抽取,並建立hive表 keberos認證 kinit kt hdfs.keytab hdfs 從oracle導資料到hive sqoop import connectjdbc oracle thin xx.xx.xx.xx 1521 xx username password tabl...