hive錯誤錦集

2021-07-28 13:58:17 字數 1145 閱讀 3706

我的hive錯誤錦集-1

效能問題:

乙個條件的錯誤

在去年寫了乙個hive指令碼,今年需求有變,條件細分。於是指令碼改動較大,也沒有考慮太多就開始改動。完成後測試執行速度,發現執行時間為改動前的三倍,當時需求很急,草草跑出資料提交了。

後來又需要該指令碼來用,才想起來效率問題,於是開始研究速度慢下來的原因。

第一次將37個步驟的執行時間分離出來,發現問題出在某乙個步驟上。這就好辦了,單獨拿出問題指令碼,如下所示:

create table temp_chbuy_28_$_$ stored as rcfile as

select

b.*from temp_chbuy_1_$_$ a

inner join

(select

*from a_table

where and socre= 1100 and length(cert) = 15 or length(cert) = 18

and month=201701 and city=8023

) bon a.month=b.month and a.city=b.city

and a.latn_id = b.latn_id

and a.own_cust_id=b.cust_id

有經驗的人可能一眼就看出問題所在了,可惜我是個菜鳥,所有根本不知道原因。於是將inner join部分單獨拿出來,可憐的我還以為這裡有問題,inner join內部的條件太多,會影響速率(確實會,但是沒那麼大),不過運氣好的是執行確實卡在了這裡

select * from a_table

where and score= 1100 and length(certr) = 15 or length(cert) = 18

and month=201701 and city=8023

這下明白了。

還有以下沒解決的問題,希望大神指點

1、hive max(tem201) 和 max(tem201*100) 資料不一致問題(取max資料,同一張表,資料沒變,就集體*100,取出結果卻不是*100之前的數)

2、group by 資料重複問題(用group by 去除重複資料,可是還是有少量資料重複,原因?)

3、hive tranket 刪除資料,沒有drop掉分割槽,分割槽太多了會報錯原因?

http錯誤錦集

http 400 請求無效 http 401.1 未授權 登入失敗 http 401.2 未授權 伺服器配置問題導致登入失敗 http 401.3 acl 禁止訪問資源 http 401.4 未授權 授權被篩選器拒絕 http 401.5 未授權 isapi 或 cgi 授權失敗 http 403 ...

專案錯誤錦集

2018.5.29 自己搭建springcloud中遇見的問題 一.加入了feign客戶端但是卻說沒有找不到這個類,但是spring boot的parent的依賴已經引入了 解決方案 1.檢視feign客戶端是否加入value,確定是呼叫那個服務 2.雖然加入了spring boot的依賴但是沒有引...

http錯誤錦集

http 400 請求無效 http 401.1 未授權 登入失敗 http 401.2 未授權 伺服器配置問題導致登入失敗 http 401.3 acl 禁止訪問資源 http 401.4 未授權 授權被篩選器拒絕 http 401.5 未授權 isapi 或 cgi 授權失敗 http 403 ...