《數學之美》初學

2021-09-16 18:42:36 字數 583 閱讀 7481

從基於語義語法進行自然語言處理轉變為基於統計的自然語言處理方法,例如萊特兄弟研製出雙翼機不是依靠仿生學而是利用了空氣動力學,可以這麼理解,我們可以從自然中發現很多人類可以利用的現象,在真正實現時我們不能侷限於從生物本能的角度去分析問題,應該及時從更加科學,深刻的角度去分析問題,比如我們可以把人類語言中自然的語法現象,日常使用的詞彙、句法等資訊轉化為字與字之間的相關性,詞與詞之間的相關性也就是用大量的資料經過統計來發現人類常用的「固定搭配」來是計算機能夠對自然語言資訊進行正確的排序。

在做事情是一開始不必追求大而全,完美的解決方案,耗時且效果很可能並不理想,先實現簡單,實用的方案來解決最重要的部分,這樣可以達到事半功倍的效果,在此基礎上再去進行優化並解決剩餘的問題。在面對棘手的問題時,要發覺簡單方法的有效性。

在計算機中處理諸多問題時,有這樣一種思維模式,將需要用計算機來處理的物件量化,就可以用計算機可以理解的模型,數學公式等等來講問題解決;例如,將自然語言處理中的語法,語義,固定搭配量化為相關性,將新聞處理中的每篇新聞文章量化為乙個向量(新聞中的主體茨維向量各個維度的座標),這樣就可以用數學中的餘弦定理解決新聞相關性的問題。

資訊的作用在於消除不確定性,自然語言處理的大量問題就是找相關的資訊。

數學之美4

第7章 賈里尼克和現代語言處理 第8章 簡單之美 布林代數和搜尋引擎 道與術 事情的原理是道,具體的做事方法叫術。追求的術的人,一生工作辛苦,只有掌握道,才能游刃有餘。追求術的人,往往是希望走捷徑,希望有乙個模型能把事情畢其功於一役,但這是不現實的。1.布林代數 就是真 假的組合四則運算 與 或 非...

數學之美6

第12 章 有限狀態機和動態規劃 地圖與本地搜尋的核心技術 1 1 位址分析和有限狀態機 1.智慧型手機導航最關鍵的三個問題 a.利用衛星定位 b.位址識別 c.根據使用者輸入的起點和終點,在地圖上規劃最短路徑或者最快路徑 2.位址分析和有限狀態機 位址的識別上下文有關文法相對簡單,最有效的是有限狀...

《數學之美》摘錄

不定期過來加幾句 2016 12 12之前部分 翻譯這件事兒之所以能達成,僅僅是因為不同的文字系統在記錄資訊上的能力是等價的。資訊的冗餘是資訊保安的保障。羅馬數字編碼方式 i代表1,v代表5,左側為減,右側為加,所以iv就是5 1 4,vii就是5 2 7。阿拉伯數字的真正發明人是印度人,只是由阿拉...