spark sql 多個where條件導致任務失敗

2021-10-21 15:04:04 字數 548 閱讀 2182

spark sql 

單條查詢

select * from aa where `逾期總金額` is not null or `累計逾期次數` is not null or `卡系統放款日期` is not null or `機構名` is not null or `賬戶狀態` is not null or `透支息` is not null or `r系統流水號` is not null or `分期餘額` is not null or `r系統產品碼` is not null or `所屬地區` is not null or `擔保企業客戶名稱` is not null or `開卡日期` is not null or `費用` is not null or `管轄行` is not null or `本金` is not null or `r系統分期金額` is not null or `該筆交易日期` is not null or `卡系統逾期期數` is not null

由於後面跟多個or條件,導致spark 任務一直假死狀態,知道拋超時,正常情況不加where條件是一步到位執行到底。

後期再補上原因

Spark SQL 常用操作

packagesqltext importorg.apache.spark.importorg.apache.spark.sql.sqlcontext importorg.apache.spark.sql.dataframe importorg.apache.spark.sql.types.impo...

spark sql內建函式

在spark 1.5.x版本,增加了一系列內建函式到dataframe api中,並且實現了code generation的優化。與普通的函式不同,dataframe的函式並不會執行後立即返回乙個結果值,而是返回乙個column物件,用於在並行作業中進行求值。column可以用在dataframe的...

spark sql 入門操作

開始from pyspark.sql import sparksession spark sparksession builder config spark.some.config.option some value getorcreate 建立dataframe spark is an exist...