隨機取樣獲取部分資料集和label

2021-10-24 03:12:17 字數 2344 閱讀 1926

numpy中的隨機數模組同樣可以進行取樣,可以利用numpy.random.choice()函式實現。

numpy.random.choice(a, size=none, replace=true, p=none)

主要有四個引數,其中

a為一維待取樣序列,

size為取樣樣本數目,

replace代表是否重複取樣,

p如果設定的話與a等長代表序列中每個位置的取樣概率。

#numpy.random.choice(a, size=none, replace=true, p=none)

#從a(只要是ndarray都可以,但必須是一維的)中隨機抽取數字,並組成指定大小(size)的陣列

#replace:true表示可以取相同數字,false表示不可以取相同數字

#陣列p:與陣列a相對應,表示取陣列a中每個元素的概率,預設為選取每個元素的概率相同。

import os,sys

import random

import shutil

def

read_file

(path)

:# 的完整路徑

"""從資料夾中讀取資料"""

files_list = os.listdir(path)

file_path_list =

[os.path.join(path, img)

for img in files_list]

file_path_list.sort(

)return file_path_list

file_path=

["e:/software_installation_package/cuda/train/image"

,"e:/software_installation_package/cuda/train/label"]if

len(file_path)!=2

:raise valueerror(

"同時需要和標籤資料夾的路徑,路徑在前"

PHP 使用POST 獲取不到部分資料問題

使用php開發的乙個專案,在測試階段客戶反饋說資料沒有儲存成功 而我之前測試是通過的,但按客戶的資訊上卻重現了問題 問題是這樣的 客戶通過瀏覽器進行儲存,但有些資料已經儲存成功,但某些資料卻沒有儲存成功 而我通過測試發現 post 某些資料竟然沒有,但有些是有的 而file get contents...

我收藏的部分資料和資源收集

在我10月9號寫的個人技能矩陣中給自己布置了幾個作業,思維導圖的作業做完了。現在開始資料和資源收集的作業。堅持最少就是最多,盡量挑選自己懂的資源和能使用的資料。用不著的東西太多了就有些煩。其實我在9月15號寫的二學位工商管理教學計畫中說到以後的研究方向。裡面羅列了一些資料 艾瑞 易觀 中國網際網路絡...

機器學習筆記3 拆分資料集和訓練集

拆分資料集和訓練集 from sklearn import cross validation for version 0.17 for version 0.18 from sklearn.model selection import train test split set the random s...