dataframe中有關inf的處理技巧

2021-09-25 02:31:32 字數 1410 閱讀 6401

numpy中inf的相關文件

ieee 754浮點表示(正)無窮大。

>>

> np.ninf

-inf

>>

> np.inf

inf>>

> np.log(0)

-inf

>>

> np.array([1

,2])

/0#碰到的最多的情況

array(

[ inf, inf]

)

目前沒看到有什麼好處,只是單純用inf表示無窮大,方便理解和表示。

對使用者而言,對inf需要特殊處理,加大了工作量。

為什麼需要特殊處理?因為許多機器學習演算法庫並不支援對inf的處理。

常見的處理方法:

'''

isinf:顯示哪些元素為正或負無窮大

isposinf:顯示哪些元素為正無窮大

isneginf:顯示哪些元素為負無窮大

isnan:顯示哪些元素不是數字

isfinite:顯示哪些元素是有限的(不是非數字,正無窮大和負無窮大中的乙個)

'''>>

> np.isinf(np.inf)

#其他函式同理使用,isinf使用最多。

true

>>

> np.isinf(np.array([1

,np.inf]))

array(

[false

,true

], dtype=

bool

)>>

>np.isinf(pd.dataframe(np.array([1

,np.inf]))

)00false

1true

>>

>s1 = pd.series([1

,2,3

,np.inf]

)>>

>s1

01.0

12.0

23.0

3 nan

dtype: float64

#對inf填補 999

>>

>s1[np.isinf(s1)]=

999>>

>s1

01.0

12.0

23.0

3999.0

dtype: float64

#對inf填補np.nan (較為常用)

>>

>s1[np.isinf(s1)

]= np.nan

>>

>s1

01.0

12.0

23.0

3 nan

dtype: float64

以上就是本文的內容,覺得好的可以關注下。

hive中有關分桶

首先,在hive中為什麼要分桶?單個分割槽或者表中的資料量越來越大,當分割槽不能更細粒度的劃分資料時,會採用分桶的技術將資料更加細粒度的劃分和管理。分割槽和分桶的區別 分割槽 乙個分割槽在表目錄之中就是目錄下的乙個檔案,在表中的字段因為是偽列,所以定義分割槽的時候應該加上 對應的字段型別。例如 cr...

oracle exp 中有關direct使用

oracle提供2種模式匯出表資料,傳統模式conventional path和直接模式direct path,有direct指定。conventional path export 比較direct path export 一 差異 1.conventional path export.傳統匯出模式...

Oracle中有關Latch的介紹

本文向各位闡述oracle的latch機制,latch,用金山詞霸翻譯是門插栓,閉鎖,專業術語叫鎖存器,我開始接觸時就不大明白為什麼不寫lock,不都是鎖嗎?只是翻譯不同而以?研究過後才知道兩者有很大的區別。latch是oracle提供的輕量級鎖資源,他用於快速,短時間的鎖定資源,防止多個併發程序同...