jieba 詞性標註

2021-09-12 21:51:19 字數 1761 閱讀 9837

以前使用jieba分詞時,並沒有注意到詞性標註集到底包含哪些,剛好最近學習自然語言處理,涉及到分詞以及詞性標註,將ictclas 詞性標註集記錄如下:

**名稱

幫助記憶的詮釋

ag形語素

形容詞性語素。形容詞**為a,語素**g前面置以a。

a形容詞

取英語形容詞adjective的第1個字母。

ad副形詞

直接作狀語的形容詞。形容詞**a和副詞**d並在一起。

an名形詞

具有名詞功能的形容詞。形容詞**a和名詞**n並在一起。

b區別詞

取漢字「別」的聲母。c連詞

取英語連詞conjunction的第1個字母。

dg副語素

副詞性語素。副詞**為d,語素**g前面置以d。d副詞

取adverb的第2個字母,因其第1個字母已用於形容詞。e嘆詞

取英語嘆詞exclamation的第1個字母。

f方位詞

取漢字「方」 的聲母。g語素

絕大多數語素都能作為合成詞的「詞根」,取漢字「根」的聲母。

h前接成分

取英語head的第1個字母。i成語

取英語成語idiom的第1個字母。

j簡稱略語

取漢字「簡」的聲母。

k後接成分

l習用語

習用語尚未成為成語,有點「臨時性」,取「臨」的聲母。m數詞

取英語numeral的第3個字母,n,u已有他用。

ng名語素

名詞性語素。名詞**為n,語素**g前面置以n。n名詞

取英語名詞noun的第1個字母。

nr人名

名詞**n和「人(ren)」的聲母並在一起。

ns地名

名詞**n和處所詞**s並在一起。

nt機構團體

「團」的聲母為t,名詞**n和t並在一起。

nz其他專名

「專」的聲母的第1個字母為z,名詞**n和z並在一起。

o擬聲詞

取英語擬聲詞onomatopoeia的第1個字母。p介詞

取英語介詞prepositional的第1個字母。q量詞

取英語quantity的第1個字母。r代詞

取英語代詞pronoun的第2個字母,因p已用於介詞。

s處所詞

取英語space的第1個字母。

tg時語素

時間詞性語素。時間詞**為t,在語素的**g前面置以t。

t時間詞

取英語time的第1個字母。u助詞

取英語助詞auxiliary 的第2個字母,因a已用於形容詞。

vg動語素

動詞性語素。動詞**為v。在語素的**g前面置以v。v動詞

取英語動詞verb的第乙個字母。

vd副動詞

直接作狀語的動詞。動詞和副詞的**並在一起。

vn名動詞

指具有名詞功能的動詞。動詞和名詞的**並在一起。

w標點符號

x非語素字

非語素字只是乙個符號,字母x通常用於代表未知數、符號。

y語氣詞

取漢字「語」的聲母。

z狀態詞

取漢字「狀」的聲母的前乙個字母。

參考:詞性標記 luw2007

分類:

python

好文要頂

關注我收藏該文

bbking

關注 - 9

粉絲 - 69

+加關注 00

基於mpi的平行計算—矩陣向量乘

linux 壓縮和解壓縮常用命令

jieba詞性標註

ag 形語素形容詞性語素。形容詞 為a,語素 前面置以a。a形容詞 取英語形容詞adjective的第1個字母。ad副形詞 直接作狀語的形容詞。形容詞 a和副詞 d並在一起。an名形詞 具有名詞功能的形容詞。形容詞 a和名詞 n並在一起。b區別詞 取漢字 別 的聲母。c連詞 取英語連詞conjunc...

Jieba分詞詞性標註以及詞性說明

import jieba import jieba.analyse import jieba.posseg def dosegment all sentence 帶詞性標註,對句子進行分詞,不排除停詞等 param sentence 輸入字元 return sentence seged jieba....

jieba分詞及詞性標註

jieba分詞及詞性標註 想著先分詞,再給分過的詞標註詞性 很簡單但是弄了蠻久 也不簡便 要學習啊 雞湯 腳踏實地,眼看前方 import jieba import jieba.posseg as pseg jieba.load userdict userdict1.txt 建立停用詞list de...