python資料分析之pandas

2021-10-05 03:15:58 字數 1367 閱讀 3555

%matplotlib inline

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

# 1.建立dataframe

dates = pd.date_range(

'20200401'

, periods=

6, freq=

'2d'

)data = pd.dataframe(data=np.random.randn(6,

4)+3

, index=dates, columns=

list

('abcd'))

# 2.重新建立

df1 = data.reindex(index=dates[0:

4], columns=

list

(data.columns)+[

'e']

)# 3.特定選擇賦值

df1.loc[dates[1:

3],'e']=

1# 4.刪除空值

df1.dropna(how=

'any'

,axis=0)

# 5.空值填充

df1.fillna(value=5)

# 6.判斷是否為空

pd.isnull(df1)

# 7.資料描述資訊

df1.describe

# 8.資料累加更新

df1.cumsum(

)df1.

(np.cumsum)

df1.cumsum(

)df1.

(lambda x:x.count(

),axis=1)

# 11.只能對series進行唯一計數

df1.loc[dates[2]

].value_counts(

)# 12.切片

df.iloc[:3

]df.iloc[7:

]# 13.concat合併 索引重排

df1 = pd.concat(

[df.iloc[0:

2], df.iloc[3:

5]], ignore_index=

true

)#14.merge 相當於sql中 inner join on

df1 = pd.merge(df.iloc[0:

2], df.iloc[3:

5],on=

'b')

# 15.簡單的分類聚合

df.groupby(

['a'

,'b'])

.sum

()

Python之資料分析(寶可夢資料分析)

在此感謝阿里雲天池平台提供的學習平台,並提供相應的教程供小白們學習資料分析。seaborn庫 seaborn 是基於 python 且非常受歡迎的圖形視覺化庫,在 matplotlib 的基礎上,進行了更高階的封裝,使得作圖更加方便快捷。即便是沒有什麼基礎的人,也能通過極簡的 做出具有分析價值而又十...

python資料分析之Numpy

numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...

Python 資料分析之scipy

scipy是一組專門解決科學計算中各種標準問題域的包的集合,主要包括下面這些包 匯入積分模組 import numpy as np 匯入numpy庫 from scipy import integrate 匯入定積分模組scipy.integrate.quad func,a,b 計算單重積分,引數分...