python資料分析裡axis 0 1 行列定義

2021-10-08 19:45:38 字數 1300 閱讀 2659

>>

> df = pd.dataframe([[

1,1,

1,1]

,[2,

2,2,

2],[

3,3,

3,3]

], \

columns=

["col1"

,"col2"

,"col3"

,"col4"])

>>

> df # 輸出

col1 col2 col3 col4

0111112

2222

3333

如果我們呼叫df.mean(axis=1),我們將得到按行計算的均值

>>

> df.mean(axis=1)

0112

23

然而,如果我們呼叫df.drop((name, axis=1),我們實際上刪掉了一列,而不是一行:

>>

> df.drop(

"col4"

, axis=1)

col1 col2 col301

1112

2223

33

其實問題理解axis有問題,df.mean其實是在每一行上取所有列的均值,而不是保留每一列的均值。也許簡單的來記就是axis=0代表往跨行(down),而axis=1代表跨列(across),作為方法動作的副詞(譯者注)

換句話說:

下圖代表在dataframe當中axis01時分別代表的含義:

軸用來為超過一維的陣列定義的屬性

二維資料擁有兩個軸:第0軸沿著行的垂直往下,第1軸沿著列的方向水平延伸。

所以問題當中第乙個列子df.mean(axis=1)代表沿著列水平方向計算均值,而第二個列子df.drop(name, axis=1)代表將name對應的列標籤(們)沿著水平的方向依次刪掉。

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...

python資料分析

陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...

python資料分析

1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...