Task04 條件隨機場

2021-10-05 14:53:57 字數 1865 閱讀 6275

理解條件隨機場最好的辦法就是用乙個現實的例子來說明它。但是目前中文的條件隨機場文章鮮有這樣幹的,可能寫文章的人都是大牛,不屑於舉例子吧。於是乎,我翻譯了這篇文章。希望對其他夥伴有所幫助。

原文在這裡[

想直接看英文的朋友可以直接點進去了。我在翻譯時並沒有拘泥於原文,許多地方都加入了自己的理解,用學術點的話說就是意譯。(畫外音:裝什麼裝,快點開始吧。)好的,下面開始翻譯!

假設你有許多小明同學一天內不同時段的**,從小明提褲子起床到脫褲子睡覺各個時間段都有(小明是**控!)。現在的任務是對這些**進行分類。比如有的**是吃飯,那就給它打上吃飯的標籤;有的**是跑步時拍的,那就打上跑步的標籤;有的**是開會時拍的,那就打上開會的標籤。問題來了,你準備怎麼幹?

乙個簡單直觀的辦法就是,不管這些**之間的時間順序,想辦法訓練出乙個多元分類器。就是用一些打好標籤的**作為訓練資料,訓練出乙個模型,直接根據**的特徵來分類。例如,如果**是早上6:00拍的,且畫面是黑暗的,那就給它打上睡覺的標籤;如果**上有車,那就給它打上開車的標籤。

這樣可行嗎?

乍一看可以!但實際上,由於我們忽略了這些**之間的時間順序這一重要資訊,我們的分類器會有缺陷的。舉個例子,假如有一張小明閉著嘴的**,怎麼分類?顯然難以直接判斷,需要參考閉嘴之前的**,如果之前的**顯示小明在吃飯,那這個閉嘴的**很可能是小明在咀嚼食物準備下嚥,可以給它打上吃飯的標籤;如果之前的**顯示小明在唱歌,那這個閉嘴的**很可能是小明唱歌瞬間的抓拍,可以給它打上唱歌的標籤。

所以,為了讓我們的分類器能夠有更好的表現,在為一張**分類時,我們必須將與它相鄰的**的標籤資訊考慮進來。這——就是條件隨機場(crf)大顯身手的地方!

啥是詞性標註問題?

非常簡單的,就是給乙個句子中的每個單詞註明詞性。比如這句話:「bob drank coffee at starbucks」,註明每個單詞的詞性後是這樣的:「bob (名詞) drank(動詞) coffee(名詞) at(介詞) starbucks(名詞)」。

下面,就用條件隨機場來解決這個問題。

以上面的話為例,有5個單詞,我們將:(名詞,動詞,名詞,介詞,名詞)作為乙個標註序列,稱為l,可選的標註序列有很多種,比如l還可以是這樣:(名詞,動詞,動詞,介詞,名詞),我們要在這麼多的可選標註序列中,挑選出乙個最靠譜的作為我們對這句話的標註。

怎麼判斷乙個標註序列靠譜不靠譜呢?

就我們上面展示的兩個標註序列來說,第二個顯然不如第乙個靠譜,因為它把第

二、第三個單詞都標註成了動詞,動詞後面接動詞,這在乙個句子中通常是說不通的。

假如我們給每乙個標註序列打分,打分越高代表這個標註序列越靠譜,我們至少可以說,凡是標註**現了動詞後面還是動詞的標註序列,要給它負分!!

上面所說的動詞後面還是動詞就是乙個特徵函式,我們可以定義乙個特徵函式集合,用這個特徵函式集合來為乙個標註序列打分,並據此選出最靠譜的標註序列。也就是說,每乙個特徵函式都可以用來為乙個標註序列評分,把集合中所有特徵函式對同乙個標註序列的評分綜合起來,就是這個標註序列最終的評分值。

現在,我們正式地定義一下什麼是crf中的特徵函式,所謂特徵函式,就是這樣的函式,它接受四個引數:

它的輸出值是0或者1,0表示要評分的標註序列不符合這個特徵,1表示要評分的標註序列符合這個特徵。

note:這裡,我們的特徵函式僅僅依靠當前單詞的標籤和它前面的單詞的標籤對標註序列進行評判,這樣建立的crf也叫作線性鏈crf,這是crf中的一種簡單情況。為簡單起見,本文中我們僅考慮線性鏈crf。

Task04條件隨機場

條件隨機場 條件隨機場是一種判別式無向圖模型。條件隨機場試圖對多個變數在給定觀測值後的條件概率進行建模。給定x x1,x 2,xn y y 1,y2 y n x x 1,x 2,dots,x n y y 1,y 2,dots,y n x x1 x2 x n y y 1 y 2 yn 均為線性鏈表示的...

機器學習演算法 Task04條件隨機場(CRF)

最近看了一些有關於crf的 基本概念懂,但是到求解的部分有些疑惑。crf問題容易構成np hard問題,求解過程還需要再學習。下面稍微介紹一些crf的學習吧,這裡前面crf內容主要參考了下面博文,講的非常好 條件隨機場 conditional random fields 是一種判別式圖模型,因為其強...

ML Day4 條件隨機場

1.馬爾科夫過程 假設乙個隨機過程中,時刻的狀態 的條件發布,只與其前一狀態 1相關 2.隱馬爾科夫演算法 隱馬爾科夫演算法是對含有未知引數 隱狀態 的馬爾可夫鏈進行建模的生成模型,在隱馬爾科夫模型中,包含隱狀態 和 觀察狀態,隱狀態 對於觀察者而言是不可見的,而觀察狀態 對於觀察者而言是可見的。隱...