python中的jieba簡單使用

2021-09-24 02:49:20 字數 768 閱讀 5393

jieba常用三個函式:jieba.lcut(x),jieba.lcut(x,cut_all = true),jieba.lcut_for_rearch(x)

**練習:

import jieba

s ="中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好\

生活需要和不平衡不從分的發展之間的矛盾。"

n = len(s)

m = len(jieba.lcut(s))

print("中文字元數{},中文詞語數{}。".format(n,m))

print("**************01***************")

k = jieba.lcut(s)

print(k)

print("**************02***************")

k1 = jieba.lcut(s,cut_all = true)

print(k1)

print("***************03**************")

k2 = jieba.lcut_for_search(s)

print(k2)

輸出結果:

python中jieba分詞的簡單應用

話不多說,上來就貼 注意編碼問題 encoding utf 8 import jieba jieba.load userdict wangzhan.txt 儲存不需要切分的重要詞語 def creadstoplist stopwordspath stwlist line.strip for line...

python的jieba簡單使用

函式 含義jieba.cut string 精確模式,返回乙個可迭代的資料型別 jieba.cut string,cut all true 全模式,輸出文字string中的所有可能的單詞 jieba.cut for search string 搜尋引擎模式,適合搜尋引擎建立索引的分詞結果 jieba...

python使用jieba實現簡單的詞頻統計

import jieba defgettext txt open hamlet.txt r read txt txt.lower for ch in txt txt.replace ch,return txtharmtxt gettext words harmtxt.split counts for...