第五章 分類和詞性標註

2021-07-05 03:30:01 字數 1257 閱讀 5804

import nltk

text = nltk.word_tokenize("and now for something completely different")

a=nltk.pos_tag(text)

分詞後進行詞性標註,cc是連詞,rb是副詞,in是介詞,nn是名詞,jj是形容詞,

可以使用

nltk.help.upenn_tagset('rb')

查詢縮寫字母代表的含義

標記含義例子

adj 形容詞new, good, high, special, big, local

adv 動詞really, already, still, early, now

cnj 連詞and, or, but, if, while, although

det 限定詞the, a, some, most, every, no

ex 存在量詞there, there's

fw 外來詞dolce, ersatz, esprit, quo, maitre

mod 情態動詞will, can, would, may, must, should

n 名詞year, home, costs, time, education

np 專有名詞alison, africa, april, washington

num 數詞twenty-four, fourth, 1991, 14:24

pro 代詞he, their, her, its, my, i, us

p 介詞on, of, at, with, by, into, under

to 詞to to

uh 感嘆詞ah, bang, ha, whee, hmpf, oops

v 動詞is, has, get, do, make, see, run

vd 過去式said, took, told, made, asked

vg 現在分詞******, going, playing, working

vn 過去分詞given, taken, begun, sung

wh wh 限定詞who, which, when, what, where, how

將詞性按頻率排列

tag_fd = nltk.freqdist(tag for (word, tag) in a)

將tag_fd轉化為鍊錶

tag_fd.keys()

將頻率分布轉化為累計分布圖

tag_fd.plot(cumulative=true)

python第五章 Python學習(第五章)

記錄所有的名片字典 card list defshow menu 顯示資訊 print 50 print 歡迎使用 名片管理系統 v1.0 print print 1.新增名片 print 2.顯示全部 print 3.搜尋名片 print print 0.退出系統 print 50 defnew ...

第五章 雜湊

雜湊表adt,只支援二叉樹查詢所允許的一部分操作。比如插入,刪除,查詢等。那些需要元素間排序資訊的操作將不會得到支援。比如findmin,findmax和線性時間按排序順序列印整個表的操作時不支援的。雜湊函式在理想狀態是能將任何兩個不同的關鍵字對映到不同的單元,但是這是不可能,因為關鍵字是無窮的,但...

第五章 函式

第五章 函式 1 函式的定義 shell函式定義可以放在 bash profile 檔案中,也可以在使用該函式的指令碼中,還可以在命令列中 通過 source 或 執行bash profile檔案,使修改能夠立即生效 function 函式名 declare f 顯示定義的函式清單 export f...