hive基礎知識

2021-08-20 03:36:42 字數 326 閱讀 8690

接觸hive也有一段時間了,一直把它當做傳統的資料庫使用的,沒有出現問題。昨天的時候遇到乙個問題,就是hive表中的資料有重複了,領導讓盡快出方案解決,我想都沒想,直接脫口就說「把重複的刪除」,同事告訴我說,hive不支援刪除。當時尷尬到家啦。。無知太可怕了,趕緊學習總結一下hive。補補這方面的欠缺。

hive簡介:hive是乙個基於hadoop檔案系統之上的資料倉儲架構。它為資料倉儲的管理提供了許多功能:資料儲存、大型資料集的查詢和分析能力。

總結大圖如下:

hive基礎知識

1.檢視hive版本號 hive version 1.2.1 2.group by 可以通過字段所在的位置進行groupby 對於1.2.1版本 set hive.groupby.orderby.position.alias true 沒有hive 287的版本,只能使用count 1 替代coun...

Hive基礎知識學習

日期 2012 09 25 字型 大 中 小 1 hive是什麼 按照我的理解,hive 是乙個中間工具。它的主要作用是將 hql hive query language 轉換為一系列的 mapreduce job 利用hadoop 框架對資料進行類 sql處理。他的主要功能是在 hadoop 框架...

Hive基礎知識點總結 DML

向表中載入資料的基本語法 load data local inpath opt module datas student.txt overwrite into table student partition partcol1 val1,具體的引數介紹 1.load data 表示載入資料 2.loc...