數學之美讀書筆記3

2021-07-06 03:43:25 字數 420 閱讀 7652

數學之美讀書筆記3

上一章講述了自然語言處理的坎坷路程,以及大牛們奮鬥的經歷。這一章我們談談為什麼統計模型在自然語言處理方面有著很大的優勢。

第一章講述了祖先們語言與現在的自然語言有著相似的地方,那就是有相同的數學規律。通過數學規律,來找到答案,往往是可行的。賈里尼克,通過分析乙個句子出現的概率大小來猜測句子是否合理,出現的概率越大,說明越合理。下面這兩幅圖是本人的推導過程,字跡醜。。。

這樣就完成了簡單的自然語言處理模型。

最後吳軍博士給了 乙個答案,那就是數學的精彩之處在於模型可以幹大事。

《數學之美》讀書筆記

通訊六要素 s是可見的 信源 o是不可見的 輸出 信宿 通訊就是要根據觀測到的o恢復出s 對於翻譯問題,漢譯英 英語是s,漢語是o,根據s推斷o tf 詞頻 idf 逆文字頻率指數 以條件隨機場為例,希望找到乙個符合所有邊緣分布的概率分布函式。根據最大熵原則 希望找到乙個符合所有邊緣分布並使熵達到最...

《數學之美》讀書筆記

之前拜讀過吳軍老師的 數學之美 雖然這是一本科普性質的讀物,但還是能從中獲益匪淺。下面根據記憶以及之前做過的簡要的書面筆記,做乙個概括。1.資訊的作用在於消除不確定性,自然語言處理的大量問題都是找相關的資訊。2.關於搜尋 技術分為術和道兩種。具體的做事方法是術,做事的原理和原則是道。只有掌握了搜尋的...

數學之美讀書筆記(一)

chapter.1文字,語言,數學,資訊 很久以前人類以不同的叫聲表示不同的資訊,達到彼此交流的目的,當所要表達的資訊太多時,叫聲已經不夠用了,於是文字產生了。1.數學,文字皆是資訊的載體 文字 知道 羅塞塔 石碑的典故。數字 進製的產生 為了表達大數,不同的文明產生了不同的數字表示方法,最終只有使...