Pandas基礎第一次打卡

目前pandas最新版本1.0.3

pandas 能讀取csv ,txt ,xls或者xls格式的檔案。

pandas 能寫入csv ,xls或者xls格式的檔案。

對於乙個series，其中最常用的屬性為值（values），索引（index），名字（name），型別（dtype）

就是表表.set_index(『索引』).head()

表.sort_values(by=『class』).head()

【問題一】 series和dataframe有哪些常見屬性和方法？

series屬性為值（values），索引（index），名字（name），型別（dtype）

series方法有series.values 返回值；series.name 返回命名；series.index返回索引；series.dtype 返回資料型別；series[『a』]返回a的值；series.mean()返回平均數等

dataframe的屬性有列和索引，與**相同

dataframe的方法有常用方法為統計資料，描述資料有describe和info、idxmax和nlarges（idxmax函式返回最大值，在某些情況下特別適用，idxmin功能類似；nlargest函式返回前幾個大的元素值，nsmallest功能類似）、groupby等

【問題二】 value_counts會統計缺失值嗎？

可以【問題三】與idxmax和nlargest功能相反的是哪兩組函式？

nsmallest():返回最小的數

idxmin():返回最小數的索引

【問題四】在常用函式一節中，由於一些函式的功能比較簡單，因此沒有列入，現在將它們列在下面，請分別說明它們的用途並嘗試使用。

sum：求和

mean: 求平均值

median: 中位數

mad: 根據平均值計算平均絕對離差

min: 最小值

max: 最大值

abs: 絕對值

std: 標準差

var: 方差

quantile: p分位數，常見為四分位

cummax: 取每一列的最大

cumsum: 每一列累加

cumprod：對每一列累乘

diff: 一階差分

pct_change: 百分數變化

corr: 計算列一列的相關性，不計算包括na / null值的列

【問題五】 df.mean(axis=1)是什麼意思？它與df.mean()的結果一樣嗎？第一問提到的函式也有axis引數嗎？怎麼使用？

df.mean(axis=1)是表示在列的水平方向算均值

df.mean()是表示在列方向算均值

b.groupby([『action_type』,『combined_shot_type』]).count()

爬蟲第一次打卡

url data headers response requests.post url,data data,headers headers 發起請求 json data response.json print json data import requests from bs4 import bea...

python第一次打卡

號表示注釋，作用於整行多行注釋，用三個雙引號運算子分為算術運算子比較運算子邏輯運算子位運算子三元運算子其他運算子運算子的優先順序一元運算子優於二元運算子，先算術運算，後移位運算，最後位運算，邏輯運算最後結合。is,is not 對比的是兩個變數的記憶體位址對比的是兩個變數的值 ...

Datawhale 第一次打卡

開源內容 1.enumerate enumerate is a built in function of python.my list banana grapes pear for c,value in enumerate my list,1 print c,value 類似於對錶進行排列，方便讀取...

Pandas基礎 第一次打卡

爬蟲第一次打卡

python第一次打卡

Datawhale 第一次打卡

相關推薦

Pandas基礎第一次打卡