《數學之美》 第二章 個人筆記

2021-08-18 21:56:43 字數 1127 閱讀 6317

數學之美

最近在讀《數學之美》這本書,做一下個人筆記。看的是pdf,看完後會買一本的哦!版權意識還是有的。

這一章開頭這句話:字母,文字,數字是資訊編碼的不同單位。任何一種語言都是一種編碼的方式,而語言的語法規則是編譯碼的演算法。我們表達乙個意思要通過語言表達出來,就是用這種語言的編碼方式表示出來,結果就輸出一串文字。別人懂這門語言的編碼方式,就會理解。這裡說的輸出一串文字,可以是字母,數字(計算機理解),和開頭說的資訊編碼的不同單位是符合的,就很好理解了。這就是語言的數學本質。

⭐①計算機能處理自然語言

⭐②它處理自然語言的方法和人類一樣

1 機器智慧型

有意思的詞:『鳥飛派』:看看鳥是怎麼飛的,就能模仿鳥造出飛機,而不需要了解空氣動力學。

下圖是前人對自然語言處理的想法(走的彎路)

單純基於文法規則的分析器是處理不了複雜的語句的,裡面有兩個不可逾越的坎兒:

①文法規則的數量太龐大,無法構建;寫到後面還會出現矛盾

②描述自然語言的文法和計算機高階程式語言的文法是不同的,計算機難以解析。作者在這裡提到了自然語言在演變過程中產生了詞義和上下文相關的特性;對於上下文無關文法,演算法的複雜度是語句長度的二次方,而對於有關文法,則是六次方。

2 從規則到統計

有趣的例子:the pan is in the box ,the box is in the pen 。這個栗子說明了語義的難處理。再有統計語言學的出現,不久後nlp從規則到統計。

ps:文中有一段講斯伯格特對未來研究方向的判斷,總讓我覺得大牛都是開掛的。還有傳統捍衛者的**就是基於統計的方法只能處理淺層的nlp問題。

3 小結

基於統計的nlp方法,在數學模型上和通訊是相通的,甚至就是相同的。因此,在數學意義上nlp又和語言的初衷——通訊聯絡在一起了。(這裡基於統計的方法是讓計算機能夠處理nl

《數學之美》 個人筆記

因為班級的活動,前段時間在網上買的一本 數學之美 終於到了。在一大堆推薦圖書之中選擇了這本,可能是因為其他的圖書太重的計算機 氣味 了吧,在課餘時間想要看一些不太一樣的。知識點 1 簡單性和模組化是軟體工程的基石 分布式和容錯性是網際網路的生命。2 有 正確設計思想方法的計數 技術 未必能夠成功,因...

Clean Code 筆記 之 第二章

這是我第二次看這本書了 clean code 的時候,第一次看的時候是,看到某世界五百強在他們的 中我竟然看不到一句注釋,現在我還記得當時的情景,當我download 下第乙份 的時候,我想在 中了解一下公司 編寫習慣以及少量的業務,在我以前的認知中,中加上很多注釋這些注釋有助於我了解業務,但是在這...

第二章筆記

1.遞迴查詢和迭代查詢 遞迴查詢是一條環路,直接想成遞迴的定義就行,你想查乙個 的ip,首先將這個 傳給它的本地dns,然後認為本地dns可以直接將ip給你,然後本地dns為了知道這個ip又詢問下個dns伺服器。從此可以看出,增加了被涉及的伺服器的資料,所以一般用迭代查詢,迭代查詢是你詢問完後給你下...