企業發票異常分析 匯入,清洗

2022-09-18 19:12:11 字數 1666 閱讀 5027

今天做了企業發票異常分析的作業成功地將資料匯入到hive資料倉當中,並對資料進行了初步的清洗

流程如下:

一.三個樣表檔案中的資料匯入hive資料倉儲中

先建三個表:

create table xxfpb(

hydm string,

xf_id string,

djzclx_dm string,

kydjrq string,

xgrq string,

label string,

fp_nid string,

je double,

se double,

jshj double,

kpyf string,

kprq string,

zfbz string

)row format delimited fields terminated by ',';

其餘兩個表的建表語句類似

然後進行資料清洗:

insert overwrite table nsrxx select substring(hydm,2,length(hydm)-1) as hydm, nsr_id as nsr_id,djzclx_dm as djzclx_dm,kydjrq as kydjrq,xgrq as xgrq,substring(label,1,length(label)-1) as label from nsrxx;

insert overwrite table zzsfp_hwmx select substring(fp_nid,2,length(fp_nid)-1) as fp_nid, date_kry as date_kry,hwmc as hwmc,ggxh as ggxh,dw as dw,sl as sl,dj as dj,je as je,se as se,substring(spbm,1,length(spbm)-1) as spbm from zzsfp_hwmx;

清洗的目的是將三個表的前括號和後括號去掉

清洗完成的結果截圖:

企業發票異常分析 分離進項與銷項

今天做的是企業發票異常分析中 zzsfp錶可通過 xf id 或者gf id 與nsrxx 中的nsr id 進行關聯,分離出銷項發票表和進項發票表 最終成功分離出進項發票表和銷項發票表 步驟如下 首先建立兩個表 create table xxfpb1 hydm string,xf id strin...

企業發票異常分析 分離進項與銷項

今天做的是企業發票異常分析中 zzsfp錶可通過xf id或者gf id與nsrxx中的nsr id進行關聯,分離出銷項發票表和進項發票表 最終成功分離出進項發票表和銷項發票表 步驟如下 首先建立兩個表 create table xxfpb1 hydm string,xf id string,djz...

未導包導致的異常

剛接觸servlet,今天將servlet和hibernate結合起來往資料庫裡面儲存資料,報了好多異常,總結了幾個如下 導slf4j api 1.6.1.jar 2.slf4j failed to load class org.slf4j.impl.staticloggerbinder slf4j...