Spark查詢多字元分隔符hive表時遇到的問題

首先要引入建立多分隔符hive表時的jar包，hive-contrib-3.1.0.3.0.0.0-1634.jar

然而使用spark-shell --jars ***/hive-contrib-3.1.0.3.0.0.0-1634.jar引入jar包後查詢多分隔符hive表時仍然提示classnotfound異常，提示類找不到，在命令列界面試下使用class.forname載入該jar包時又沒有提示找不到該類的異常，說明類應該是載入到類路徑下了。

之後修改日誌級別為：debug級別，檢視更加詳細的內容，查到了在找該類時是使用isolatedclientloader這個類載入器載入的，同時還分成custom defining、hive class等幾種類。

將spark.sql.hive.metastore.barrierprefixes=org.apache.hadoop.hive.contrib.serde2.multidelimitserde加到啟動引數中：

spark-shell --master local[4] --conf spark.sql.hive.metastore.barrierprefixes=org.apache.hadoop.hive.contrib.serde2.multidelimitserde --jars xx/hive-contrib-3.1.0.3.0.0.0-1634.jar

ok,查詢成功！最後就是不知道**可以控制isolationon這個引數。isolationon預設是開啟的，只要關閉了，就會直接使用baseclassloader類載入器，這樣就不用設定多餘引數了

不知道是否有更簡潔的方法

Spark查詢多字元分隔符hive表時遇到的問題

Hive建表時指定分隔符或使用多字元分隔

Oracle 根據分隔符分隔字串

Spark實戰練習02 處理分隔符

Spark查詢多字元分隔符hive表時遇到的問題

Hive建表時指定分隔符或使用多字元分隔

Oracle 根據分隔符分隔字串

Spark實戰練習02 處理分隔符

相關推薦