《Python自然語言處理》筆記 將文字當做詞鍊錶

2021-08-22 16:25:59 字數 756 閱讀 2983

1. 文字統計

len(text1)#text1從頭到尾的長度,包含單詞和標點符號

set(text2)#獲得text2的詞彙表

sorted(set(text3))#獲得text3詞彙表的排序表

len(set(text4))#獲得text4詞彙表的長度

len(text5)/len(set(text5))#獲得text5的詞彙豐富度,即,每個詞平均使用的次數

text6.count("the")#計數單詞the在文字text6中出現的次數

100*text7.count("a")/len(text7)#計數詞頻

2. 鍊錶操作

sent1=["i","go","to","park","."]#定義鍊錶sent1並賦值

sent2=text1[2:8]#取文字text1的text1[2]到text[7]作為鍊錶sent2的內容

sent3=text2[:5]#把text2[0]到text2[4]賦值給鍊錶sent3

sent4=text3[1000:]#把text3[1000]到text3末尾賦值給鍊錶sent4

sent5=sent3+sent4#連線連個鍊錶,snet3在前,sent4在後

sent5[5]#訪問sent[5]

sent5.index('the')#取乙個詞the在文字中首次出現的索引

sent5[3,7]=["a","suprise"]#鍊錶片段的替換,鍊錶中sent[3]到sent5[6]這四個元素被集體替換為a suprise

《python自然語言處理》筆記

工欲善其事,必先利其器 資源準備 python matplotlib包安裝見我的部落格 通過大量的例子和聯絡,python自然語言處理 將會幫助你 前言 為什麼使用python?操作file.txt檔案,輸出所有字尾是 ing 的詞。coding utf 8 for line in open r d...

《Python自然語言處理》

python自然語言處理 基本資訊 出版社 人民郵電出版社 isbn 9787115333681 出版日期 2014 年6月 開本 16開 頁碼 508 版次 1 1 所屬分類 計算機 軟體與程式設計 python 更多關於 python自然語言處理 內容簡介 書籍計算機書籍 自然語言處理 natu...

自然語言處理

自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...