如何每日增量載入資料到Hive分割槽表

2021-07-10 16:35:17 字數 1199 閱讀 8639

載入資料

資料載入到hive分割槽表(兩個分割槽,日期(20160316)和小時(10))中

每日載入前一天的日誌檔案資料到表db_track.track_log

>> 資料儲存

說明: 資料日誌檔案,放入某個目錄下

>>>> 每天日誌檔案放入同乙個目錄

20160316 - 目錄名稱

>>>> 日誌檔案資料,每個小時生成乙個檔案,一天總共有二十四個檔案

2016031820

#!/bin/sh

## 環境變數生效

. /etc/profile

## 日誌目錄

log_dir=/data/tracklogs

## 目錄名稱

yesterday=`date -d -1day '+%y%m%d'`

##hive home

## 迴圈目錄

for line in `ls $/$`

doecho

"loading $ ....."

##從檔名稱中解析出日期和小時

daily=$

hour=$

##echo $ $

load_file=$/$/$

## 命令載入

#$/bin/hive -e "load data local inpath '$' overwrite into table db_track.track_log partition(date='$',hour='$');"

##檔案載入

$/bin/hive --hiveconf load_file_parm=$ --hiveconf daily_parm=$ --hiveconf hour_parm=$

-f /home/ycong/load_data.sql

done

load data local inpath '$' overwrite into

table db_track.track_log partition(date='$',hour='$');

## night 1:30 exute min hour

daymonth week

301 * * * /bin/sh /home/ycong/load_track_logs.sh

如何每日增量載入資料到Hive分割槽表

hadoop hive shell crontab 資料載入到hive分割槽表 兩個分割槽,日期 20160316 和小時 10 中 每日載入前一天的日誌檔案資料到表db track.track log 資料日誌檔案,放入某個目錄下,每天日誌檔案放入同乙個目錄 eg 20160316 目錄名稱 日誌...

sqoop定時增量抽取資料到hive

1 第一次全量抽取,並建立hive表 keberos認證 kinit kt hdfs.keytab hdfs 從oracle導資料到hive sqoop import connectjdbc oracle thin xx.xx.xx.xx 1521 xx username password tabl...

載入中 Excel中如何載入資料到模型

從傳統的excel資料操作,到bi智慧型分析,載入資料到資料模型是第一步,這幾乎是個小白問題,可是架不住有好幾個人問,那就來扯扯.1.excel端直接載入 這個選單功能,非常明顯,很容易找到 2.模型端載入資料 選擇把資料直接載入到資料來源的方式,適合原始資料比較規整的情況。3.從pq過度後載入 如...