資料科學導論1

2021-10-05 19:12:44 字數 3009 閱讀 8398

掌握numpy陣列物件ndarray

屬性說明

ndim

返回int。表示陣列的維數

shape

返回tuple。表示陣列的尺寸,對於n行m列的矩陣,形狀為(n,m)

size

返回int。表示陣列的元素總數,等於陣列形狀的乘積

dtype

返回data-type。描述陣列中元素的型別

itemsize

返回int。表示陣列的每個元素的大小(以位元組為單位)

陣列建立

numpy.array(

object

.dtype=

none

,copy=

true

,order=

'k',subok=

false

,ndmin=

0)

引數名稱

說明object

接受array。表示想要建立的陣列。無缺省

dtype

接受data-type。表示陣列所需的資料型別。如果未給定,則選擇儲存物件所需的最小型別。預設為none。

ndmin

接受int。指定生成陣列應該具有的最小維數。預設為none

首先匯入numpy包

import numpy as np
建立陣列並檢視屬性
arr1=np.array([1

,2,3

,4])

print

(arr1)

[1,2,3,4]

arr2=np.array([[

1,2,

3,4]

,[1,

2,4,

5],[

3,4,

6,8]

])print

(arr2)

[ [1 2 3 4]

[1 2 4 5]

[3 4 6 8] ]

arr2.shape
(3,4)

arr2.size
重新設定陣列的shape屬性
arr2.shape=4,

3print

(arr2)

[ [1 2 3]

[4 1 2]

[4 5 3]

[4 6 8] ]

使用arange函式建立陣列

通過指定開始值,終止值,步長來建立一維陣列,預設設定不包括終止值。

print

(np.arange(0,

1,0.1)

)#初始值 終止值 步長

[0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]

注意不包括1,右邊是開區間

使用linspace函式建立陣列

通過指定開始值、終止值、元素個數來建立一維陣列,預設設定包括終止值。

print

(np.linspace(0,

1,10)

)

[0 0.11111111 0.22222222 0.33333333 0.44444444 0.55555556 0.66666667 0.88888889 1]

使用logspace函式建立等比數列

下例生成10^0 ~ 10^1之間的20個元素的等比數列

print

(np.logspace(0,

1,20)

)

[ 1. 1.12883789 1.27427499 1.43844989 1.62377674 1.83298071 2.06913808 2.33572147 2.6366509 2.97635144 3.35981829 3.79269019 4.2813324 4.83293024 5.45559478 6.15848211 6.95192796 7.8475997 8.8586679 10. ]

使用zeros函式建立陣列
print

(np.zeros((2

,5))

)

[[0. 0. 0. 0. 0.]

[0. 0. 0. 0. 0.]]

使用eye函式建立陣列
print

(np.eye(5)

)

[[1. 0. 0. 0. 0.]

[0. 1. 0. 0. 0.]

[0. 0. 1. 0. 0.]

[0. 0. 0. 1. 0.]

[0. 0. 0. 0. 1.]]

使用diag函式建立陣列
print

(np.diag([1

,2,3

,4])

)

[[1 0 0 0]

[0 2 0 0]

[0 0 3 0]

[0 0 0 4]]

使用ones函式建立陣列
print

(np.ones((5

,3))

)

[[1. 1. 1.]

[1. 1. 1.]

[1. 1. 1.]

[1. 1. 1.]

[1. 1. 1.]]

電腦科學導論 資料計算

四 算術運算 整數和小數在計算機記憶體中計算的實現 1 邏輯運算 2 移位運算 3 算數運算 1 非 not 取反,遇一為零,遇零為一。2 與 and 同一為一,其餘為零。3 或 or 遇一為一,同零為零。4 異或 xor 相同為零,不同為一。1 非 not 取反。2 與 and 掩碼,指定位置復位...

山東大學 資料科學導論 期末

一.簡答 1.dirty data在哪些過程怎麼產生 2.解釋entity resolution 3.兩個向量,計算距離 歐式,曼哈頓,漢明,切比雪夫,余弦 二.好像也是簡答?1.mapreduce 1 設計map和reduce方法實現表自然連線 2 兩個表的例項,根據表寫mapreduce自然連線...

資料科學導論課程筆記(二) 資料視覺化

資料視覺化是一項致力於把抽象的資料或概念轉化為適於人類理解和接受的視覺化的資訊的技術。是乙個典型的交叉學科,涉及電腦科學,認知心理學,美學和藝術設計等學科,涉及資料處理 演算法設計和軟體開發和人機互動等多種知識和技能。視覺化是一種以影象 圖表或動畫的形式進行有效資訊傳遞的技術。它的主要目的在於,作為...