hive 資料倉儲面試題目集錦

2022-04-04 00:09:32 字數 448 閱讀 8330

內部表和外部表的區別:

未被external修飾的是內部表(managed table),被external修飾的為外部表(external table);

區別:內部表資料由hive自身管理,外部表資料由hdfs管理;

內部表資料儲存的位置是hive.metastore.warehouse.dir(預設:/user/hive/warehouse),外部表資料的儲存位置由自己制定(如果沒有location,hive將在hdfs上的/user/hive/warehouse資料夾下以外部表的表名建立乙個資料夾,並將屬於這個表的資料存放在這裡);

刪除內部表會直接刪除元資料(metadata)及儲存資料;刪除外部表僅僅會刪除元資料,hdfs上的檔案並不會被刪除;

對內部表的修改會將修改直接同步給元資料,而對外部表的表結構和分割槽進行修改,則需要修復(msck repair table table_name;)

資料倉儲工具hive面試題集錦

進入date時代,大資料技術成為網際網路發展的核心要素之一。與此同時大資料開發工程師的薪資也成為行業內高薪的代表。想從事大資料開發需要掌握多種核心技術 hadoop hive storm spark scala等等。而且這些技術知識點已經成為大資料工程師進入職場時面試中必備的考點。這裡黑馬程式設計師...

資料倉儲面試題

資料倉儲面試問題彙總 1.用hive實現交集 並集 差集 交集 用inner join 就可以實現 並集 union 順便說一下union all 和union 的區別,union 會去除重複項因此要慢一點,而union all 不會 差集 left join on a.id b.id where ...

Hive 資料倉儲

hive命令列模式 1 進入bin 執行.hiv 2 配置hive環境變數,直接執行命令 hive service cli 或 hive hive的web模式 執行hive service hwi 啟動後訪問http master 9999 hwi hive的遠端服務 預設埠 10000,執行啟動命...