機器學習科學計算庫使用

2021-10-06 23:59:20 字數 3427 閱讀 4308

設定大小

fig = plt.figure (figsize = (20,8),dpi = 80)

長,寬; dpi==>每英吋畫素,數值越大越清晰

匯入pyplot工具

import

import matplotlib.pyplot as plt

設定大小,使用figure方法

plt.figure(figsize=(20

,8),dpi=

80)

處理引數

x:很座標引數是可迭代物件,可以是range,tuple,list等,生成器不可以

y:可迭代物件形式給定

對座標刻度及刻度描述標籤進行設定,使用 xticks/yticks 屬性(方法)進行設定

plt.xticks(_x[::

3], _xticks_lables[::

3],rotation =45)

# 至少傳入兩個引數,第乙個是x的刻度,第二個是x軸的刻度標籤,兩者是一一對應的關係,rotation設定顯示角度

呼叫繪圖命令,不同的圖形顯示使用不同的命令,命令**如下:

plt.comand(x,y,關鍵字傳參)
comand: plot:繪製折線圖

​ scatter: 繪製散點圖

​ bar:繪製矩形圖,橫向顯示的使用barh

# 新增圖例,顯示上面設定的label標籤

plt.legend(

)

# 設定座標軸的標籤顯示

plt.xlabel(

'時間'

)plt.ylabel(

'溫度'

)plt.show(

)

建立陣列:

陣列的形狀

陣列的運算

同維度的陣列運算

不同維度的陣列運算

結論:列相同的陣列進行算數運算,結果等於對應位置的元素算數運算後組成的陣列

不同維度的陣列進行運算時,相同的形狀的對應位置進行計算。軸

問題點:1.bool索引

資料檔案格式 : csv:comma-separated value,逗號分隔值檔案

顯示:**狀態

原始檔:換行和逗號分隔行列的格式化文字,每一行的資料表示一條記錄

呼叫函式

​ 二維陣列中的轉置方法:

numpy中的索引和切片

numpy中數值修改

只需要取出後直接賦值就可以

陣列的拼接

兩種拼接方式:豎直拼接,水平拼接

np.vstack(t1,t2):將t1和t2進行豎直方向上 的拼接,t1在上,t2在下

np.hstack(t1,t2):將t1和t2進行水平方向上的拼接,t1在左,t2在右

注意:水平分割是豎直畫條線,與水平拼接是互逆過程,豎直分割同理

陣列的行列交換

使用索引和切片的方式

行交換:t[[1,2],:] = t[[2,1],:]# 交換1行和2行的資料

列交換:t[:,[0,2]] = t[:,[2,0]]# 交換0列和2列的資料

獲取最大值最小值的位置

numpy生成隨機數

numpy中的nan型資料是浮點數,nan即缺失資料

陣列中有nan的計算方法:將nan的數值替換為均值或者中值。

t.mean(axis=0):求平均值

numpy中的常用統計函式

求和:t.sum(axis=none)

均值:t.mean(a,axis=none) 受離群點的影響較大

中值:np.median(t,axis=none)

最大值:t.max(axis=none)

最小值:t.min(axis=none)

極值:np.ptp(t,axis=none) 即最大值和最小值只差

標準差:t.std(axis=none)

numpy中的nan替換方法

幫助我們處理非數值型的資料

常用的資料型別

1. series,一維資料,帶標籤的陣列

2. dataframe,二維資料,series容器

pandas讀取外部資料

pandas常用統計方法

獲取行索引用什麼,shape(1)?shape[1]是什麼

set_index後,原資料是否改變

reset_index,是新增還是替換?

data[:10]獲取前10行元素

genre_count = zeros_df.sum(axis = 0).sort_values()

_x = genre_count.index

_y = genre_count.values

plt.figure(figsize = (20,8),dpi = 80)

plt.bar(_x,_y)

plt.show()

* pandas資料合併

預設情況下他時把航航索引相同的資料合併到一起

# 問題

獲取行索引用什麼,shape(1)?shape[1]是什麼

set_index後,原資料是否改變

reset_index,是新增還是替換?

data[:10]獲取前10行元素

機器學習 (科學計算庫)1

資料決定了機器學習結果的上限,而演算法只是盡可能逼近這個上限。1,機器學習是從資料中自動分析獲得模型,並利用模型對未知資料進行 機器學習工作流程總結 1,獲取資料 2,資料基本處理 3,特徵工程 4,機器學習 模型訓練 5,模型評估 資料簡介 一行資料稱為乙個樣本 一列資料稱為乙個特徵 機器學習一般...

科學計算 安裝GNU的開源科學計算庫gsl

gsl是gnu的乙個開源科學計算庫,c語言的。不過感覺使用人群小了點,最近一次更新是在2011年。gnu的專案有好多是費了的,純粹的開源不尋求商業途徑很難撐下去。下面是專案主頁 專案主頁 原始碼和其他開源的一樣,解壓後,輸入.confiure,make,make install。最後乙個一定要sud...

科學計算 安裝GNU的開源科學計算庫gsl

gsl是gnu的乙個開源科學計算庫,c語言的。不過感覺使用人群小了點,最近一次更新是在2011年。gnu的專案有好多是費了的,純粹的開源不尋求商業途徑很難撐下去。下面是專案主頁 專案主頁 原始碼和其他開源的一樣,解壓後,輸入.confiure,make,make install。最後乙個一定要sud...