《Python自然語言處理》

2022-07-09 01:36:12 字數 3707 閱讀 4490

《python自然語言處理》

基本資訊

出版社:人民郵電出版社

isbn:9787115333681

出版日期:2014 年6月

開本:16開

頁碼:508

版次:1-1

所屬分類:計算機 > 軟體與程式設計 > python

更多關於》《python自然語言處理》

內容簡介

書籍計算機書籍

自然語言處理(natural language processing,nlp)是電腦科學領域與人工智慧領域中的乙個重要方向。它研究能夠實現人與計算機之間用自然語言進行有效通訊的各種理論和方法,涉及所有用計算機對自然語言進行的操作。

《python自然語言處理》是自然語言處理領域的一本實用入門指南,旨在幫助讀者學習如何編寫程式來分析書面語言。本書基於python程式語言以及乙個名為nltk的自然語言工具包的開源庫;但並不要求讀者有python程式設計的經驗。全書共11章,按照難易程度順序編排。第1章到3章介紹了語言處理的基礎,講述如何使用小的python程式分析感興趣的文字資訊。第4章討論結構化程式設計,以鞏固前面幾章中介紹的程式設計要點。第5章到第7章介紹語言處理的基本原理,包括標註、分類和資訊提取等。第8章到第10章介紹了句子解析、句法結構識別和句意表達方法。第11章介紹了如何有效管理語言資料。後記部分簡要討論了nlp領域的過去和未來。

《python自然語言處理》的實踐性很強,包括上百個實際可用的例子和分級練習。本書可供讀者用於自學,也可以作為自然語言處理或計算語言學課程的教科書,或是人工智慧、文字挖掘、語料庫語言學等課程的補充讀物。

作譯者

steven bird是墨爾本大學電腦科學和軟體工程系副教授,賓夕法尼亞大學語言學資料聯盟高階研究助理。

ewan klein是愛丁堡大學資訊學院語言技術教授。

edward loper是畢業於賓夕法尼亞大學專注於機器學習的自然語言處理方向的博士,現在在波士頓的bbn technologies擔任研究員。

目錄

《python自然語言處理》

第1章 語言處理與python 1

1.1 語言計算:文字和詞彙 1

1.2 近觀python:將文字當做詞鍊錶 10

1.3 計算語言:簡單的統計 17

1.4 回到python:決策與控制 24

1.5 自動理解自然語言 29

1.6 小結 35

1.7 深入閱讀 36

1.8 練習 37

第2章 獲得文字語料和詞彙資源 41

2.1 獲取文字語料庫 41

2.2 條件頻率分布 55

2.4 詞典資源 63

2.5 wordnet 72

2.6 小結 78

2.7 深入閱讀 79

2.8 練習 80

第3章 處理原始文字 84

3.1 從網路和硬碟訪問文字 84

3.2 字串:最底層的文字處理 93

3.3 使用unicode進行文書處理 100

3.4 使用正規表示式檢測片語搭配 105

3.5 正規表示式的有益應用 109

3.6 規範化文字 115

3.7 用正規表示式為文字分詞 118

3.8 分割 121

3.9 格式化:從鍊錶到字串 126

3.10 小結 132

3.11 深入閱讀 133

3.12 練習 134

第4章 編寫結構化程式 142

4.1 回到基礎 142

4.2 序列 147

4.3 風格的問題 152

4.4 函式:結構化程式設計的基礎 156

4.5 更多關於函式 164

4.6 程式開發 169

4.7 演算法設計 175

4.8 python庫的樣例 183

4.9 小結 188

4.10 深入閱讀 189

4.11 練習 189

第5章 分類和標註詞彙 195

5.1 使用詞性標註器 195

5.2 標註語料庫 197

5.3 使用python字典對映詞及其屬性 206

5.4 自動標註 216

5.5 n-gram標註 221

5.6 基於轉換的標註 228

5.7 如何確定乙個詞的分類 230

5.8 小結 233

5.9 深入閱讀 234

5.10 練習 235

第6章 學習分類文字 241

6.1 監督式分類 241

6.2 監督式分類的舉例 254

6.3 評估 258

6.4 決策樹 263

6.5 樸素貝葉斯分類器 266

6.6 最大熵分類器 271

6.7 為語言模式建模 275

6.8 小結 276

6.9 深入閱讀 277

6.10 練習 278

第7章 從文字提取資訊 281

7.1 資訊提取 281

7.2 分塊 284

7.3 開發和評估分塊器 291

7.4 語言結構中的遞迴 299

7.5 命名實體識別 302

7.6 關係抽取 306

7.7 小結 307

7.8 深入閱讀 308

7.9 練習 308

第8章 分析句子結構 312

8.1 一些語法困境 312

8.2 文法的用途 316

8.3 上下文無關文法 319

8.4 上下文無關文法分析 323

8.5 依存關係和依存文法 332

8.6 文法開發 336

8.7 小結 343

8.8 深入閱讀 344

8.9 練習 344

第9章 建立基於特徵的文法 349

9.1 文法特徵 349

9.2 處理特徵結構 359

9.3 擴充套件基於特徵的文法 367

9.4 小結 379

9.5 深入閱讀 380

9.6 練習 381

第10章 分析語句的含義 384

10.1 自然語言理解 384

10.2 命題邏輯 391

10.3 一階邏輯 395

10.4 英語語句的語義 409

10.5 段落語義層 422

10.6 小結 428

10.7 深入閱讀 429

10.8 練習 430

第11章 語言資料管理 434

11.1 語料庫結構:案例研究 434

11.2 語料庫生命週期 439

11.3 資料採集 443

11.4 使用xml 452

11.5 使用toolbox資料 459

11.6 使用olac元資料描述語言資源 463

11.7 小結 466

11.8 深入閱讀 466

11.9 練習 467

後記 470

參考文獻 476

互動出版網

自然語言處理

自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...

自然語言處理

前言 自然語言處理 natural language processing 是計算科學領域與人工智慧領域中的乙個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理是一門融語言學 電腦科學 數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言...

自然語言處理

一 字串操作 去空格及特殊符號 s hello,world 預設把左右空格去掉 print s.strip print s.lstrip hello,print s.rstrip 查詢字元 0 為未找到 sstr1 strchr sstr2 tr 找到返回目標子串開始下標 npos sstr1.in...