python資料分析常用函式

2021-07-26 21:36:55 字數 2183 閱讀 8001

for 目標 in 對像:

print 賦值目標

1.for迴圈字串操作

>>>a = 'iplaypython.com'

>>>for i in a:

>>>    print i

案例中的 i 相當於目標,字串變數a是遍歷(迭代)對像。當執行for迴圈語句時,每一次迭代時,i 都會從遍歷(迭代)對像a中接收乙個新值輸出。結束迴圈後,目標(迭代變數)會保留最後乙個值。

2.for 迴圈元組賦值

in後面的是乙個元祖陣列,比如這種 [(1,2),(3,4),(5,6)]

>>>x =[('hello','python'),('very','good')]

>>>for (a,b) in x:

>>>    print (a,b)

('hello', 'python')

('very', 'good')

3.scipy匯入檔案

scipy.io.

loadmat()

4.numpy.mean()陣列求均值計算

numpy.

mean(a, axis=none, dtype=none, out=none, keepdims=

)

a--------------運算矩陣

axis----axis後面的值是指定乙個軸做運算

eg:

>>> a=

np.array

([[1,2

],[3,

4]])

>>> np.

mean(a

)2.5

>>> np.

mean(a

,axis=0

)array([ 2., 3.])

>>> np.

mean(a

,axis=1

)array([ 1.5, 3.5])

5.1----------如果對乙個列表,既要遍歷索引又要遍歷元素時,首先可以這樣寫:
list1 = ["這", "是", "乙個", "測試"]

for i in range (len(list1)):

print i ,list1[i]

5.2---------------------上述方法有些累贅,利用enumerate()會更加直接:
list1 = ["這", "是", "乙個", "測試"]

for index, item in enumerate(list1):

print index, item

>>>

0 這1 是

2 乙個

3 測試

5.3-----------------enumerate還可以接收第二個引數,用於指定索引起始值,如:
list1 = ["這", "是", "乙個", "測試"]

for index, item in enumerate(list1, 1):

print index, item

>>>

1 這2 是

3 乙個

4 測試

5.4------------若統計檔案的行數,可以這樣寫:

count = len(open(filepath, 'r').readlines())

這種方法簡單,但是可能比較慢,當檔案比較大時甚至不能工作。

可以利用enumerate():

count = -1

for index, line in enumerate(open(filepath,'r')):

count += 1

資料分析常用函式

匿名函式lambda 是指一類無需定義識別符號 函式名 的函式或子程式。格式 冒號前是引數,可以有多個,用逗號隔開,冒號右邊的為表示式。其實lambda返回值是乙個函式的位址,也就是函式物件。說明 lambda函式並不能提高程式效率,只是為了是 更加簡潔。單個引數 g lambda x x 2pri...

資料分析常用Excel函式

不寫一遍看來我是記不住了 預處理 instance num 可選引數是數值形式,預設全部替換 start num 表示第幾位開始查詢,預設為1。注意返回值為find text在整個字串中的位置而不是從查詢位開始的位置。關聯匹配 lookup lookup value,array lookup 查詢的...

numpy常用函式(資料分析

1.np.asarray array和asarray都可以將結構資料轉化為ndarray,但是主要區別就是當資料來源是ndarray時,array仍然會copy出乙個副本,占用新的記憶體,但asarray不會 2.np.linalg.norm 求兩陣列歐式距離 參考文獻 1 linalg linea...