jieba(結巴)分詞種詞性簡介

2021-08-01 09:20:55 字數 1513 閱讀 8789

jieba為自然語言語言中常用工具包,jieba具有對分詞的詞性進行標註的功能,詞性類別如下:ag

形語素形容詞性語素。形容詞**為 a,語素**g前面置以a。a

形容詞取英語形容詞 adjective的第1個字母。ad

副形詞直接作狀語的形容詞。形容詞** a和副詞**d並在一起。an

名形詞具有名詞功能的形容詞。形容詞** a和名詞**n並在一起。b

區別詞取漢字「別」的聲母。c

連詞取英語連詞 conjunction的第1個字母。dg

副語素副詞性語素。副詞**為 d,語素**g前面置以d。d

副詞取 adverb的第2個字母,因其第1個字母已用於形容詞。e

嘆詞取英語嘆詞 exclamation的第1個字母。f

方位詞取漢字「方」g

語素絕大多數語素都能作為合成詞的「詞根」,取漢字「根」的聲母。h

前接成分

取英語 head的第1個字母。i

成語取英語成語 idiom的第1個字母。j

簡稱略語

取漢字「簡」的聲母。k

後接成分l

習用語習用語尚未成為成語,有點「臨時性」,取「臨」的聲母。m

數詞取英語 numeral的第3個字母,n,u已有他用。ng

名語素名詞性語素。名詞**為 n,語素**g前面置以n。n

名詞取英語名詞 noun的第1個字母。nr

人名名詞** n和「人(ren)」的聲母並在一起。ns

地名名詞** n和處所詞**s並在一起。nt

機構團體

「團」的聲母為 t,名詞**n和t並在一起。nz

其他專名

「專」的聲母的第 1個字母為z,名詞**n和z並在一起。o

擬聲詞取英語擬聲詞 onomatopoeia的第1個字母。p

介詞取英語介詞 prepositional的第1個字母。q

量詞取英語 quantity的第1個字母。r

代詞取英語代詞 pronoun的第2個字母,因p已用於介詞。s

處所詞取英語 space的第1個字母。tg

時語素時間詞性語素。時間詞**為 t,在語素的**g前面置以t。t

時間詞取英語 time的第1個字母。u

助詞取英語助詞 auxiliaryvg

動語素動詞性語素。動詞**為 v。在語素的**g前面置以v。v

動詞取英語動詞 verb的第乙個字母。vd

副動詞直接作狀語的動詞。動詞和副詞的**並在一起。vn

名動詞指具有名詞功能的動詞。動詞和名詞的**並在一起。w

標點符號x

非語素字

非語素字只是乙個符號,字母 x通常用於代表未知數、符號。y

語氣詞取漢字「語」的聲母。z

狀態詞取漢字「狀」的聲母的前乙個字母。un

未知詞不可識別詞及使用者自定義詞組。取英文unkonwn首兩個字母。(非北大標準,csw分詞中定義)

注意:import jieba.posseg #需要另外載入乙個詞性標註模組

結巴分詞jieba

全模式text 我來到北京清華大學 seg list jieba.cut text,cut all true print u 全模式 join seg list 精確模式 seg list jieba.cut text,cut all false print u 精確模式 join seg list...

jieba分詞詞性

jieba詞性類別如下 ag形語素 形容詞性語素。形容詞 為 a,語素 前面置以a。a形容詞 取英語形容詞 adjective的第1個字母。ad副形詞 直接作狀語的形容詞。形容詞 a和副詞 d並在一起。an名形詞 具有名詞功能的形容詞。形容詞 a和名詞 n並在一起。b區別詞 取漢字 別 的聲母。c連...

結巴分詞 詞性標註

1 簡介 詞性 part of speech 是詞彙基本的語法範疇,通常也稱為詞類,主要用來描述乙個詞在上下文的作用。例如,描述乙個概念的詞就是名詞,在下文引用這個名詞的詞就是代詞。有的詞性經常會出現一些新的詞,例如名詞,這樣的詞性叫做開放式詞性。另外一些詞性中的詞比較固定,例如代詞,這樣的詞性叫做...