初學資料分析 一 利用numpy實現矩陣標準化

2021-08-15 19:22:26 字數 639 閱讀 4220

大資料分析中許多情況下需要用到矩陣標準化(使該矩陣每一列的平均值為0,標準差為1)

here is the formula:(x-mean())/std()

以上運算是按列進行的,因為通常大資料分析中的矩陣x n*m,其中每一行代表乙個資料,而列代表不同的性質,既是n個資料,每個資料有m種性質

應用:假設現在已經有乙個.npy元資料檔案,我們打算用numpy來將它標準化,於是首先將其load進來,然後分別計算mean和std,如下:

import numpy as np

x = np.load('data.npy')

x-=np.mean(x,axis=0)

x/=np.std(x,axis=0)

有必要解釋一下numpy中的這兩個函式

np.mean(x,axis=0) 表示按列求x的平均值,axis=0表示按列進行

np.std(x,axis=0) 表示按列求x的標準差,axis=0表示按列進行

關於這兩個函式的用法和引數,詳見這裡

於是現在便得到了x的標準化矩陣了

當然我們之後還能將它顯示出來,將矩陣生成圖形之後,plt.show()顯示圖形即可

利用numpy資料分析 酒鬼漫步

在一片空曠的平地上,有乙個酒鬼,他最初停留在原點的位置,這個酒鬼每走一步時,方向是不確定的,在經過時間t之後,我們希望計算出這個酒鬼與原點的距離。這個酒鬼走了2000步 每步0.5公尺 向前走一步記為1,向後走一步記為 1,當計算距原點的距離時,就是將所有的步數進行累計求和。1 使用random模組...

numpy資料分析

2020 11 2 import array arr array.array i list range 10 i表示整型,生成序列後不能改變資料型別 多維陣列ndarray方便處理多維度運算,運算效率高 nparr np.array list range 10 修改值,浮點數取整數段 nparr 2...

資料分析 Numpy

什麼是numpy numpy這個詞 於兩個單詞 numerical和python。numpy是python中的乙個運算速度非常快的乙個數學庫,它非常重視陣列,很多的資料科學的包都是依賴於numpy的。它允許你在python中進行向量和矩陣計算,並且由於許多底層函式實際上是用c編寫的,因此你可以體驗在...