自然語言處理演算法精講 P1

2022-06-30 16:18:11 字數 593 閱讀 6548

1.3 nlp六個重要術語

syntax: 詞性分類

morphology: 時態(現在時,過去時,第三人稱)

semantics:詞意

1.4  語言學的發展史1

羅素悖論: 自己索引自己時,發生的悖論

例: 存在兩種書,a種書索引自己,b種書不索引自己

現要寫一本大全c彙總a,b,索引自己和不索引自己的

問: c中是否應該將自己寫進去

1)因為c到目前為止沒有索引自己 所以應該寫到b中

2)一旦寫入b中,就是索引了自己,寫入a中

韋根斯坦:  language game

我們通過語言交換腦中的影象

1.5 語言學的發展史2 (看到1.41)

norm chomsky :句法結構

1.7 函式 functions

1)是乙個對映  

2)指數,對數,softmax   ,relu

3) 復合函式

1.8 向量

向量的模中:

1) 一階範數

2) 二階範數,p階範數

1.10 凸函式和凸集合

1)一條線上所有的點都在集合內部

1 自然語言處理描述

資訊時代最重要的技術之一,理解複雜的語言表達方式也是人工智慧重要的一部分。自然語言處理應用無處不再,因為人們基本上所有的事情都是通過語言進行交流。常見的應用 在自然語言處理技術背後有大量的基礎技術任務和機器學習模型。當前,深度學習方法在很多不同的自然語言處理應用中取得了非常好的效能。在深度學習技術中...

自然語言處理 TF IDF演算法

當我們去了解一篇文章是不是我們所需要時就要去看摘要,看關鍵字,而對於關鍵字的提取使用的主要流行的演算法就是if idf和textrank演算法,此篇博文重點是對if idf演算法的學習。3 詞頻 逆文件頻次演算法 tf idf 是由兩部分組成,其中tf演算法是用於統計乙個詞在一篇文件出現的頻次,id...

自然語言處理(1) 詞彙標註

如何進行詞彙標註呢?首先進行資料預處理,例如如果給定的是句子,先要對句子進行分割 最簡單的標註器,可以給定詞彙使用得最頻繁的詞性作為標註器中該詞彙的詞性,但是由於詞彙存在二義性,使得這種標註準確度受限,通過上下文語境,可以在一定程度上解決這個問題,可以採用n gram標註器,此外,brill標註器具...