如何入門自然語言處理

2022-08-01 10:06:07 字數 1521 閱讀 2564

直接做文字分類這個專案,具體的思路很簡單。把原始文字變成向量,然後呼叫sklearn庫里的分類演算法,就可以實現文字分類了!

如何把文字轉換為文字向量呢?看這篇文章即可,手把手地教你把中文文字變成向量(附**)

盡量地去理解**,**的實現思路,以後遇到類似問題能不能轉換成相應的資料格式,繼續用這些**操作。

完整的實現文字分類這個專案之後不要驕傲,以為自己很厲害了,可以縱橫nlp界了。接下來你要開始有體系地去學習

書籍也是宗成慶教授的著作

回覆關鍵字自然語言處理入門,便可以領取資源

經典書籍我推薦《python自然語言處理》以及《數學之美》這兩本書

《python自然語言處理》這本書很適合我們小白來讀,作者感覺就是以我們小白的角度來寫的。裡面主要是處理英文資料的,你可以試著用書裡的方法來操作中文資料,這樣你會更好的落實和理解書中的**。

《數學之美》這本書我感覺就是在說自然語言處理方向的技術原理,可以拿來做科普。比如你想做什麼演算法了,可以先拿這本書讀一讀,對你要用到的演算法有個初步了解

到了這個階段你的理論知識基本完備,至少不那麼迷茫了。接下來你可以開始做專案,讀**了。當然沒事兒的時候還要多多翻閱這兩本經典之作,基本做機器學習方向就不能忽略這兩本書了。李航的《統計學習方法》,周志華的西瓜書《機器學習》。

1)專案

做專案的話你肯定要有資料,中文的資料不好找,這裡有乙份關於中文資料的彙總,可以參考一下。

中文文字語料庫整理

專案有很多,比如命名實體識別,實體關係抽取,知識圖譜等等。

命名實體識別系列你可以參考這裡的部落格操作,中文命名實體識別總結

2)**

自然語言處理方向的**資料可以看這篇部落格,裡面會教你怎麼找**

初學者如何查閱自然語言處理(nlp)領域學術資料

到了這裡,入門是肯定入門了,後續發展就看你自己了。沒事兒讀讀**,做做比賽,悠哉遊哉!!!

歡迎掃碼關注

自然語言處理如何入門

ps 筆者會持續更新 俗話說得好 做research或者學習某個技能最重要的是要對自己的research要非常熟悉 3mins讓別人聽懂你做的這玩意兒是個啥,contribution在 讓別人覺得你做的東西有意義 自然語言包括許多分支,主要有 機器翻譯 自動文摘 資訊檢索 文件分類 問答系統 資訊過...

自然語言處理入門

1 首先,將原文本拆分為句子,在每個句子中過濾掉停用詞 可以不選 並只保留指定詞性的單詞,由此可以得到句子和單詞的集合。2 每個單詞作為pagerank中的乙個節點。設視窗大小為k,假設乙個句子所組成的單詞可以表示為w1,w2,w3,wn.則w1,w2,wk w2,w3,wk 1 w3,w4,wk ...

自然語言處理

自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...