jieba分詞自定義dict字典

2021-09-12 14:27:32 字數 544 閱讀 2754

下面是沒有加入字典之前:

import jieba

text = "我想知道區塊鏈有什麼用"

a= jieba.cut(text)

print("/".join(a))

===》我/想/知道/區塊/鏈有/什麼/用

下面是加入字典之後:

首先要在同乙個包下面建立乙個tet檔案,

然後裡面寫上你要不分開的詞,詞頻,詞性(可省略)

如 塊鏈 3 n 將 塊鏈 這個詞切割開

再用jieba.load_userdict(「user_dict.txt」)這個函式匯入txt檔案

import jieba

text = "我想知道區塊鏈有什麼用"

jieba.load_userdict("user_dict.txt")

cut_result = jieba.cut(text)

print("/".join(cut_result))

===》我/想/知道/區/塊鏈/有/什麼/用

jieba 分詞自定義詞典問題

只對長詞起作用 對如果定義的詞比jieba自己分的短,則沒有用 下面是三種分詞方式的影響 python view plain copy encoding utf 8 import jieba import os import sys test text 號碼查詢 精確模式 seg list jieb...

jieba分詞自定義詞庫無效果

首先我自定義了乙個詞庫,內容為 乾清宮 5 太和殿 3 黃琉璃瓦 3 午門 1 我是乙個 5 凱的試接 1我的分詞內容為 故宮的著名景點包括乾清宮 太和殿和黃琉璃瓦等我是乙個好孩子我是乙個好孩子我是乙個好孩子 故宮的著名景點包括乾清宮 太和殿和黃琉璃瓦等凱的試接 故宮的著名景點包括乾清宮 太和殿和黃...

jieba結巴分詞加入自定義詞典

新增自定義詞典 動態調整詞典 參考jieba官方文件 jieba.cut 以及 jieba.cut for search 返回的結構都是乙個可迭代的 generator,可以使用 for 迴圈來獲得分詞後得到的每乙個詞語 unicode 或者用 jieba.lcut 以及 jieba.lcut fo...