Label的設計以及特徵列

2021-08-14 09:47:47 字數 654 閱讀 4437

對於監督學習內容,標籤(label)是乙個很重要的內容。有了資料(data)和標籤(labels),就可以利用監督學習通用框架進行建模了。

1、標籤的型別

(1)單列0-1值(二分類問題,乙個樣本只屬於一類並且一共只有兩類)

(2)單列連續值(單回歸問題,要**的值只有乙個)

(3)多列0-1值(多分類問題,同樣是乙個樣本只屬於一類但是一共有多類)

(4)多列連續值(多回歸問題,能夠**多個值)

(5)多標籤(多標籤分類問題,但是乙個樣本可以屬於多類)

2、標籤的設計

不妨設label為y,label的設計大致有兩種:

(1)y = 1,2,3分別代表第1類、第2類以及第3類;

(2)y = [1 0 0],[0 1 0],[0 0 1]分別代表第1類、第2類以及第3類;

對於實際問題,我們通常採用第二種形式,因為第二種形式沒有加入先驗知識,第一種label的設計加入了距離資訊,因此不適合作為label。

3、特徵列

特徵列 (feature column) - 一種說明估算器進行訓練和推理所需特徵的資料結構。

有關詳細介紹戳tensorflow 特徵列介紹。

事務的特徵以及Hibernate事務

事務應該具有4個屬性 原子性 一致性 隔離性 永續性。這四個屬性通常稱為acid特性。hibernate封裝了jdbc和jta事務,應用程式可以繞過hibernate api,直接通過jdbc和jta的api來宣告事務。其中,jta可以用來處理分布式事務。應用程式通過hibernate api宣告事...

機器學習中的特徵 特徵選擇的方法以及注意點

an introduction to feature selection 主要是我對這篇文章的乙個總結與我個人的一些認識。特徵選擇和降維有著些許的相似點,這兩者達到的效果是一樣的,就是試圖去減少特徵資料集中的屬性 或者稱為特徵 的數目 但是兩者所採用的方式方法卻不同 降維的方法主要是通過屬性間的關係...

機器學習中的特徵 特徵選擇的方法以及注意點

an introduction to feature selection 主要是我對這篇文章的乙個總結與我個人的一些認識。特徵選擇和降維有著些許的相似點,這兩者達到的效果是一樣的,就是試圖去減少特徵資料集中的屬性 或者稱為特徵 的數目 但是兩者所採用的方式方法卻不同 降維的方法主要是通過屬性間的關係...