one hot編碼例子介紹

2021-10-10 16:06:39 字數 378 閱讀 9869

最近在看tf框架,挺有意思的。在文字分類部分中再一次看到了one-hot編碼,查了些資料,在此做乙個記錄。

我們先來看乙個one-hot編碼的例子。

假設字典中包含以下元素。

dict = [我,我們,愛,中國,你好,有趣]

一般的字典會包含10^6乃至更多的字詞,在這裡我們僅僅舉例。

那麼對於以下詞語,如何進行one-hot編碼呢?

『我們』:(0,1,0,0,0,0)

『中國』:(0,0,0,1,0,0)

『你好』:(0,0,0,0,1,0)

就是詞語在字典**現的位置。

同時,詞語進行one-hot編碼後得到的向量與詞典維度相同。

這不禁讓我疑問:怎麼解決維度**這種情況呢?

one hot編碼理解

one hot是比較常用的文字特徵特徵提取的方法。one hot編碼,又稱 獨熱編碼 其實就是用n位狀態暫存器編碼n個狀態,每個狀態都有獨立的暫存器位,且這些暫存器位中只有一位有效,說白了就是只能有乙個狀態。下面舉例說明 有四個樣本,每個樣本有三種特徵 feature1 feature2 featu...

onehot編碼解釋

one hot編碼,又稱為一位有效編碼,主要是採用n位狀態暫存器來對n個狀態進行編碼,每個狀態都由他獨立的暫存器位,並且在任意時候只有一位有效。one hot編碼是分類變數作為二進位制向量的表示。這首先要求將分類值對映到整數值。然後,每個整數值被表示為二進位制向量,除了整數的索引之外,它都是零值,它...

one hot 編碼的實現

對 mnist 手寫字元識別 資料集進行手寫數字分類,屬於多分類問題,手寫數字 0 9,共 10 類,從 mnist.pkl.gz 檔案中解析得到的字元影象 28 28 的標籤 label,或者目標值 只有 1 維,進行 one hot 編碼可將其編碼為 10 維,數字 0,編碼為 1,0,0,0,...