CSV檔案匯入Hive出現中文亂碼問題

2021-10-05 20:34:20 字數 681 閱讀 3856

在將csv檔案資料匯入hive資料倉儲時出現中文亂碼問題,現將解決方案記錄下

1, 先將csv檔案編碼設定為utf-8格式

2, 建立hive表

create

table

ifnot

exists tmp.sample_table (

id string,

name string

)row format serde 'org.apache.hadoop.hive.serde2.opencsvserde'

with serdeproperties (

'separatorchar'

=','

,'quotechar'

='"'

,'serialization.encoding'

='gbk'

)stored as textfile

tblproperties (

'skip.header.line.count'

='1'

);

3, 匯入csv資料至hive

hive -e "load data local inpath 'path' overwrite into table tmp.sample_table;"
4, 檢查資料是否正常

從CSV檔案匯入Hive出現中文亂碼問題解決

關於hive中文亂碼問題的解決辦法,網上有很多帖子,然而很多都是基於linux終端顯示字元的修改,其實上對於一些條件下的hive中文亂碼問題是無法解決的,如從csv檔案匯入到hive中出現的中文亂碼問題。大家都知道,hive原生的字元編碼是採用utf 8方式的,這是支援中文的。然而在從oracle匯...

將csv或者Excel檔案匯入到hive

1.將csv或excel檔案轉換為文字,以逗號或者製表符都可以 xigua.txt id,color,root,stroke,venation,umbilical,touch,status 1,青綠,蜷縮,濁響,清晰,凹陷,硬滑,是 2,烏黑,蜷縮,沉悶,清晰,凹陷,硬滑,是 3,烏黑,蜷縮,濁響,...

將虛擬機器本地csv檔案匯入hive

1 首先,先將windows系統下的csv檔案上傳到虛擬機器目錄中。我的是在 my dbdata 下 2 啟動hive,我提前建立了乙個名為toutiao的hive業務資料庫。建立時使用的命令 create database if not exists toutiao comment user,ne...