AI 機器學習(7) CRF 一看就懂

2022-06-27 10:15:13 字數 1880 閱讀 3159

1.crf定義

conditional random fields-條件隨機場是一種判別模型,可以用於**序列資料,通過使用過去的上下文資訊,使模型達到更好的**效果。

2.crf應用:

crf 可以對序列資料建模,nlp 領域有很多應用。

例如 :parts-of-speech tagging,這個任務依賴之前的單詞,通過使用 feature functions ,可以用 crf 來判別哪些單詞對應哪個 pos。

named entity recognition,crf 可用於**多變數相互依賴的序列。

還可用於的 parts-recognition,基因**等任務.

3.hmm與crf 區別:

hmm 是有向圖,crf 是無向圖;

hmm 計算的是狀態和觀測的聯合概率,而 crf 計算的是狀態基於觀測的條件概率。

hmm 多用於那種狀態「原生」,觀測是狀態「生成」出來的場景。如,用 hmm 來生成一段語音,則狀態對應的是音節(聲韻母)或文字,而觀測則是這個音節所對應的聲學特徵。

crf 則多用於那種觀測「原生」。狀態「後天」產生,用來標記觀測的情況。如,用 crf 來做文字實體標記。輸入一句話「我有乙個蘋果」,crf 處理後將「蘋果」標記成了「水果」。這個時候,「蘋果」是觀測,而「水果」則是對應的狀態。

4.必知概念:圖、極大圖、勢函式、分離、特徵函式、

這些概念我如何表達呢,就用圖、函式表達,取名團、極大團、勢函式、特徵函式等,下面會分別對這些名詞做些解釋。

5.crf的三個問題

4.1   團、極大團

團:任意都有邊連線。

極大團:無法再加節點。

4.2   勢函式

那這些圖怎麼表示呢?這就引出了勢函式的概念。上述的圖->數學表示式。我總要表示或者計算出來。

上圖的表示式就是

勢函式是非負實函式。乙個團就是乙個勢函式。多個團和團關係,稱聯合概率。變成數學公式就是勢函式乘積。

這種團和函式的關係就是 hammersley-clifford定理表達的內容。

馬兒可夫隨機場數學表示式成正概率分布的充要條件。

4.3分離

4.4特徵函式

實值函式,用來刻畫資料的一些可能成立或期望成立的經驗特性。

5.crf的三個問題

AI 機器學習(7) CRF 一看就懂

1.crf定義 conditional random fields 條件隨機場是一種判別模型,可以用於 序列資料,通過使用過去的上下文資訊,使模型達到更好的 效果。2.crf應用 crf 可以對序列資料建模,nlp 領域有很多應用。例如 parts of speech tagging,這個任務依賴之...

一看就懂的SwitchHosts

switchhosts 是乙個管理 切換多個 hosts 方案的工具。它是乙個免費開源軟體。日常開發工作中,我們可能經常需要切換各種 hosts 繫結,比如在本地開發時可能需要乙個開發環境的 hosts 繫結方案,發布到測試環境後又有乙個測試環境的 hosts 繫結方案,然後可能還有乙個預發布環境,...

一看就懂TCP 連線

我們先來看乙個定義。這樣理解比較抽象。我們換個角度。它的本質還是傳輸控制。如果讓我們自己設計這個傳輸,我們會怎麼想呢。tcp 協議它會先建立連線。三次握手目的是保證雙方都有傳送和接收的能力 首要原因是為了防止舊的重複連線初始化造成混亂。同步雙方初始序列號客戶端和服務端都處於 closed 狀態。先是...