python資料分析基礎 擷取資料

2021-10-03 05:23:00 字數 1369 閱讀 8736

linux+pycharm+anaconda

import pandas as pd

#拿出資料,某幾行或某幾列

data=pd.dataframe([[

20,99999,6

],[30

,999999,6

],[20

,999994],

[27],

[30,999999,6

]])data.columns=

["年齡"

,"收入"

,"家屬數"

]data.index=

[i for i in

range(5

)]#通過傳去表頭拿資料

data[

["收入"

,"年齡"]]

#通過傳去具體位置拿資料(前行後是列)

data.iloc[:,

[0,2

]]#選擇所有行中的第一和第三列

#切片方法獲取資料

data.iloc[::

2,::

2]#篩選符合條件的資料,bool索引篩選

condition=data[

"年齡"

]>

25data[condition]

#loc[[行表頭],[列表頭]]和iloc[[行索引],[列索引]]

#bool值和列表頭篩選,多條件雙中括號

data[data[

"年齡"

]>25]

[["收入"

,"家屬數"]]

#混合篩選,ix[行索引,[列表頭]],棄用

data.ix[0:

2,["年齡"

,"收入"]]

#replace替換,得指定被替換的源資料

new_data=data[

'收入'

].replace(

99999

,999998

)#替換nana值,相當於fillna(),np.nan是python對缺失值的表示方式

new_data=data.replace(np.nan,

999955

)#多對對替換,data.replace()

#排序ascending,false降序,true公升序

new_data=data.sort_values(by=

["年齡"

],ascending=

false

)#通過na_position將確實值顯示在最前面

new_data=data.sort_values(by=

["收入"

],na_position=

"first"

)new_data

python基礎分析 資料分析 Python基礎

學python前要明確其使用目的。學python是為了進行資料分析,所以現階段最主要的任務是了解python的最基礎知識,然後通過運用python進行資料分析的專案,從而學會使用python。一 資料型別 1 整數 浮點數 字串 2 列表 list 2list.count obj 統計某個元素在列表...

python基礎資料分析

單樣本t檢驗 乙個連續變數與乙個數值的顯著性關係 sm.stats.descrstatsw a b ttest mean 0.1 0.1為引數 雙樣本t檢驗 乙個分類變數 二分類 與乙個連續變數的顯著性關係 方差齊性檢查 a1 creditcard exp a b 0 c a2 creditcard...

python資料分析基礎

python資料分析基礎 學資料分析之前應該明白整個資料分析的基本流程 1.明確需求與目的 2.資料收集 3.資料預處理 4.資料分析 5.編寫報告 假設檢驗,也稱為顯著性檢驗,是通過樣本的統計量,來判斷與總體引數之間是否存在差異 差異是否顯著 即我們對總體引數進行一定的假設,然後通過收集到的資料,...