Python Pandas資料分析

2021-10-24 16:44:25 字數 1660 閱讀 2290

1、讀取csv

import numpy as np # linear algebra

import pandas as pd

heart_data = pd.read_csv(

'kaggle/framingham_heart_disease.csv'

)

2、預覽資料
# 預設顯示從頭開始的5行資料

print

(heart_data.head())

# 自定義顯示多少行資料

print

(heart_data.head(1)

)# 列印一下末尾的資料,預設5行

print

(heart_data.tail())

# 自定義行數

3、丟棄指定列/行

#刪除0、1、2...中的某行

heart_data1 = heart_data.drop([2

])#刪掉列

heart_data2 = heart_data.drop(

['currentsmoker'

,'education'

], axis =

'columns'

)#將所有含有nan項的row刪除

heart_data3 = heart_data.dropna(

)#將在列的方向上三個為nan的項刪除

heart_data4 = heart_data.dropna(axis=

1,thresh=3)

#將全部項都是nan的row刪除

heart_data5 = heart_data.dropna(how=

'all'

)

4、按標題名讀取資料
# 直接.values出來的是list[array],所以利用索引[0]可以讀取array:age_data 

age_data =

[heart_data[

"age"

].values][0

]# 單個資料

print

(hist_data[1]

)

5、檢查資料是否有缺失
print

(heart_data.isnull().

sum(

))

6、顯示特定列的缺失
series = heart_data[

'cigsperday'

].isnull(

)print

(heart_data[series]

)

7、填補缺失
cigs = heart_data[

'cigsperday'

]cigs.fillna(

99, inplace =

true

)# 此時沒有na了

print

(heart_data.isnull().

sum(

))

python Pandas讀取資料

import pandas as pd fpath 檔案路徑 df pd.read csv fpath 使用pd.read csv讀取資料 df.head 檢視前幾行資料 df.shape 檢視資料的形狀返回df的行數和列數 df.columns 檢視df的列名 df.index 檢視索引列 df....

python pandas資料分組相關

資料的分組 先初始化資料 import pandas as pd import numpy as np data df pd.dataframe data groupby 分組使用groupby函式,與mysql的相同 分組之後從乙個df變成group物件,裡面是多個df group物件再呼叫聚合函...

python pandas資料探勘實驗

import pandas as pd isir pd.read table r c users asus desktop iris pandas.csv sep print isir.head sepallength sepalwidth petallength petalwidth specie...