資料傾斜通用處理方式

hive 、mr、 spark

以mr為例，目前有p1 和 p2 兩個分割槽， p1分區內有1億條資料，key值為a ,p2分區內有一萬條資料,key值為b

以sql為例

首先，為key加上隨機數，進行一次分割槽， ( select 聚合函式,如count* from group by key+隨機數 ) t1 然後在上面sql的基礎上進行二次分割槽 select 聚合函式 from t1

group by key去掉隨機數

使用flink直接呼叫rebalance()運算元或rescale()運算元

rebalance運算元會將各個分區內的資料打散再分割槽,rescale運算元功能和rebalance運算元相同，但效率更高

串列埠資料接收的常用方式有三種使用狀態機機制通過判斷結束字元的方式通過資料接收超時的方式使用狀態機機制，這種方式常用於接收16進製制資料的情況，比較典型的例子是modbus rtu資料的接收。這種方式能夠及時的處理接收到的資料，但是寫程式太繁瑣，而且通用性差，不同的協議狀態機就不一樣。使用狀...

在struts2中封裝了自己的異常處理方式。我們在專案中可以根據自己的需要來處理自己的異常。可以建乙個異常資訊封裝類，將專案中常見異常資訊進行封裝，常見資訊包括 1.異常種類如資料庫操作異常應用操作異常業務異常，如許可權不夠等系統異常如應用伺服器異常 2.具體異常如該資料庫不存在...