Pandas基礎 第一次打卡

2021-10-05 06:55:44 字數 1378 閱讀 6850

目前pandas最新版本1.0.3

pandas 能讀取csv ,txt ,xls或者xls格式的檔案。

pandas 能寫入csv ,xls或者xls格式的檔案。

對於乙個series,其中最常用的屬性為值(values),索引(index),名字(name),型別(dtype)

就是表表.set_index(『索引』).head()

表.sort_values(by=『class』).head()

【問題一】 series和dataframe有哪些常見屬性和方法?

series屬性為值(values),索引(index),名字(name),型別(dtype)

series方法有series.values 返回值;series.name 返回命名;series.index返回索引;series.dtype 返回資料型別;series[『a』]返回a的值;series.mean()返回平均數等

dataframe的屬性有列和索引,與**相同

dataframe的方法有常用方法為統計資料,描述資料有describe和info、idxmax和nlarges(idxmax函式返回最大值,在某些情況下特別適用,idxmin功能類似;nlargest函式返回前幾個大的元素值,nsmallest功能類似)、groupby等

【問題二】 value_counts會統計缺失值嗎?

可以【問題三】 與idxmax和nlargest功能相反的是哪兩組函式?

nsmallest():返回最小的數

idxmin():返回最小數的索引

【問題四】 在常用函式一節中,由於一些函式的功能比較簡單,因此沒有列入,現在將它們列在下面,請分別說明它們的用途並嘗試使用。

sum:求和

mean: 求平均值

median: 中位數

mad: 根據平均值計算平均絕對離差

min: 最小值

max: 最大值

abs: 絕對值

std: 標準差

var: 方差

quantile: p分位數,常見為四分位

cummax: 取每一列的最大

cumsum: 每一列累加

cumprod: 對每一列累乘

diff: 一階差分

pct_change: 百分數變化

corr: 計算列一列的相關性,不計算包括na / null值的列

【問題五】 df.mean(axis=1)是什麼意思?它與df.mean()的結果一樣嗎?第一問提到的函式也有axis引數嗎?怎麼使用?

df.mean(axis=1)是表示在列的水平方向算均值

df.mean()是表示在列方向算均值

b.groupby([『action_type』,『combined_shot_type』]).count()

爬蟲第一次打卡

url data headers response requests.post url,data data,headers headers 發起請求 json data response.json print json data import requests from bs4 import bea...

python第一次打卡

號 表示注釋,作用於整行 多行注釋,用三個雙引號 運算子分為算術運算子 比較運算子 邏輯運算子 位運算子 三元運算子 其他運算子 運算子的優先順序 一元運算子優於二元運算子,先算術運算,後移位運算,最後位運算,邏輯運算最後結合。is,is not 對比的是兩個變數的記憶體位址 對比的是兩個變數的值 ...

Datawhale 第一次打卡

開源內容 1.enumerate enumerate is a built in function of python.my list banana grapes pear for c,value in enumerate my list,1 print c,value 類似於對錶進行排列,方便讀取...