python資料分析筆記 2Pandas基礎

2021-10-08 06:01:08 字數 3508 閱讀 2758

2.dataframe操作

3.pandas匯**計和計算

額外說明:

1.python title() 方法返回"標題化"的字串,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle())。

2.python str.format()函式,它增強了字串格式化的功能。基本語法是通過 {} 和 : 來代替以前的 % 。

format 函式可以接受不限個引數,位置可以不按順序。

3.python 字典(dictionary) keys() 函式以列表返回乙個字典所有的鍵。

series常用屬性和函式彙總

import pandas as pd
建立series

series(data, index=index, name=name)
series建立方式:

pd.series(np.arange(5)

)

np.arange

函式返回乙個有終點和起點的固定步長的排列,如[1,2,3,4,5],起點是1,終點是5,步長為1。

引數個數情況: np.arange()函式分為乙個引數,兩個引數,三個引數三種情況

1)乙個引數時,引數值為終點,起點取預設值0,步長取預設值1。

2)兩個引數時,第乙個引數為起點,第二個引數為終點,步長取預設值1。

3)三個引數時,第乙個引數為起點,第二個引數為終點,第三個引數為步長。其中步長支援小數

參考參考文獻2

import pandas as pd

ser1 = pd.series([10

,20,30

,40,50

], index=

['a'

,'b'

,'c'

,'d'

,'e'])

ser2 = pd.series(

range(5

))x1 = ser1.drop(

'c')

print

('drop刪除後的結果x_1為:\n'

, x1)

print

('drop刪除後源資料:\n'

, ser1)

print

('\n'

)x2 = ser1.drop(

['a'

,'e'])

print

('drop刪除後的結果x_2為:\n'

, x2)

print

('drop刪除後源資料:\n'

, ser1)

print

('\n'

)x3 = ser1.pop(

'c')

print

('pop刪除的x_3為:\n'

, x3)

print

('pop刪除後源資料:\n'

, ser1)

print

('\n'

)x4 = ser2.pop(3)

print

('pop刪除的x_4為:\n'

, x4)

print

('pop刪除後源資料:\n'

, ser2)

drop刪除後的結果x_1為:

a 10

b 20

d 40

e 50

dtype: int64

drop刪除後源資料:

a 10

b 20

c 30

d 40

e 50

dtype: int64

drop刪除後的結果x_2為:

b 20

c 30

d 40

dtype: int64

drop刪除後源資料:

a 10

b 20

c 30

d 40

e 50

dtype: int64

pop刪除的x_3為:

30pop刪除後源資料:

a 10

b 20

d 40

e 50

dtype: int64

pop刪除的x_4為:

3pop刪除後源資料:

使用iloc切片方法注意:loc 更加靈活多變,**可讀性更高,iloc **簡潔,但可讀性不高,建議多使用 loc 方法

插入一列新增一行

刪除行

修改dataframe中的資料

pandas庫是基於numpy,可以用numpy提供的函式對資料進行描述性統計。

describe方法能支援對category型別的資料進行描述性統計

Python資料分析筆記

數值型字元型 資料結構 取值 true 真 false 假 運算規則 與 一假為假,兩真為真 true true true false false false 或 兩假為假,一真為真 true true true false false falsenot 非 非真為假,非假為真 not true n...

Python資料分析與應用學習筆記2

分析特徵間的關係 2.折線圖 分析特徵內部資料分布與分散狀況 2.餅圖 3.箱線圖 第一部分主要作用是構建出一張空白的畫布,並可以選擇是否將整個畫布劃分為多個部分,方便在同一幅圖上繪製多個圖形的情況。最簡單的繪圖可以省略第一部分,而後直接在預設的畫布上進行圖形繪製。plt.figure 建立乙個空白...

Python資料分析筆記(二)

接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...