機器學習中常見的專業術語

2022-06-06 18:45:10 字數 1538 閱讀 6041

模型(model):計算機層面的認知

學習演算法(learning algorithm),從資料中產生模型的方法

資料集(data set):一組記錄的合集

示例(instance):對於某個物件的描述

樣本(sample):也叫示例

屬性(attribute):物件的某方面表現或特徵

特徵(feature):同屬性

屬性值(attribute value):屬性上的取值

屬性空間(attribute space):屬性張成的空間

樣本空間/輸入空間(samplespace):同屬性空間

特徵向量(feature vector):在屬性空間裡每個點對應乙個座標向量,把乙個示例稱作特徵向量

維數(dimensionality):描述樣本引數的個數(也就是空間是幾維的)

學習(learning)/訓練(training):從資料中學得模型

訓練資料(training data):訓練過程中用到的資料

訓練樣本(training sample):訓練用到的每個樣本

訓練集(training set):訓練樣本組成的集合

假設(hypothesis):學習模型對應了關於資料的某種潛在規則

真相(ground-truth):真正存在的潛在規律

學習器(learner):模型的另一種叫法,把學習演算法在給定資料和引數空間的例項化

**(prediction):判斷乙個東西的屬性

標記(label):關於示例的結果資訊,比如我是乙個「好人」。

樣例(example):擁有標記的示例

標記空間/輸出空間(label space):所有標記的集合

分類(classification):**是離散值,比如把人分為好人和壞人之類的學習任務

回歸(regression):**值是連續值,比如你的好人程度達到了0.9,0.6之類的

二分類(binary classification):只涉及兩個類別的分類任務

正類(positive class):二分類裡的乙個

反類(negative class):二分類裡的另外乙個

多分類(multi-class classification):涉及多個類別的分類

測試(testing):學習到模型之後對樣本進行**的過程

測試樣本(testing sample):被**的樣本

聚類(clustering):把訓練集中的物件分為若干組

簇(cluster):每乙個組叫簇

監督學習(supervised learning):典範--分類和回歸

無監督學習(unsupervised learning):典範--聚類

未見示例(unseen instance):「新樣本「,沒訓練過的樣本

泛化(generalization)能力:學得的模型適用於新樣本的能力

分布(distribution):樣本空間的全體樣本服從的一種規律

獨立同分布(independent and identically distributed,簡稱i,i,d.):獲得的每個樣本都是獨立地從這個分布上取樣獲得的。

機器學習專業術語

在機器學習方法中,泛化能力通俗來講就是指學習到的模型對未知資料的 能力。在實際情況中,我們通常通過測試誤差來評價學習方法的泛化能力。泛化能力 generalization ability 是指乙個機器學習演算法對於沒有見過的樣本的識別能力。我們也叫做舉一反三的能力,或者叫做學以致用的能力。舉個例子,...

photoshop的專業術語

在學習ps的過程中,經常會遇到一些專業術語,下面我們來對一些ps常用的 並且比較難理解的術語進行簡單講解。上圖中每乙個小方格就是乙個象素點,它記載著影象的各種資訊。上圖中的黑白相間的細線就是選擇區的邊界,對影象的操作只對選擇區內有效。上圖是對不同羽化值選區填充的效果。上圖中是對消除鋸齒和保留鋸齒的選...

AOP中的專業術語介紹

一 aop簡介 aop aspect oriented programming,面向切面程式設計 是一種新的方 是對傳統 oop object oriented programming,物件導向程式設計 的補充。aop 的主要程式設計物件是切面 aspect 而切面是把橫切關注點 模組化 在應用 a...