jieba 庫 未完待續

2021-09-29 21:58:59 字數 1896 閱讀 9263

1.安裝

pip無所不能直接 pip install jieba即可

2. cut和lcut的區別

jieba.cut生成的是乙個生成器,generator,也就是可以通過for迴圈來取裡面的每乙個詞。

jieba.lcut 直接生成的就是乙個list

import jieba

s="在我的身下**吧,三樓的人們啊"

cut = jieba.cut(s)

print

(cut)

for i in cut:

print

(i)lcut = jieba.lcut(s)

print

("lcut: "

,lcut)

for i in lcut:

print

(i)#

# building prefix dict from the default dictionary ...

# loading model cost 1.232 seconds.

# prefix dict has been built succesfully.

# 在# 我

# 的# 身下

# **

# 吧# ,

# 三樓

# 的# 人們

# 啊# lcut: ['在', '我', '的', '身下', '**', '吧', ',', '三樓', '的', '人們', '啊']

# 在# 我

# 的# 身下

# **

# 吧# ,

# 三樓

# 的# 人們

# 啊

cut的三種模式
import jieba

ori =

'這種是四軸無人機植保機,帶有四個噴嘴,主要是噴灑農藥,因為螺旋槳產生的風是下壓的,能讓農藥打到植被的根底部,讓植被更容易吸收'

strs = jieba.cut(ori, cut_all=

true

)print

('全模式cut:'

,','

.join(strs)

)strs = jieba.cut(ori, cut_all=

false

)print

('精確模式cut:'

,','

.join(strs)

)strs = jieba.cut_for_search(ori)

print

('cut_for_search:'

,','

.join(strs))**

****

****

****

****

****

****

****

****

****

****

****

輸出結果:

全模式cut: 這種,是,四,軸,無人,無人機,人機,植保,機,

,,帶有,四個,噴嘴,

,,主要,要是,噴灑,農藥,

,,因為,螺旋,螺旋槳,產生,的,風,是,下壓,的,

,,能,讓,農藥,打到,植被,的,根底,底部,

,,讓,植被,更,容易,吸收

精確模式cut: 這種,是,四軸,無人機,植保,機,,,帶有,四個,噴嘴,,,主要,是,噴灑,農藥,,,因為,螺旋槳,產生,的,風,是,下壓,的,,,能,讓,農藥,打,到,植被,的,根,底部,,,讓,植被,更,容易,吸收

cut_for_search: 這種,是,四軸,無人,人機,無人機,植保,機,,,帶有,四個,噴嘴,,,主要,是,噴灑,農藥,,,因為,螺旋,螺旋槳,產生,的,風,是,下壓,的,,,能,讓,農藥,打,到,植被,的,根,底部,,,讓,植被,更,容易,吸收

nginx 未完待續

yum install y pcre yum install y pcre devel yum install y openssl yum install y openssl devel yum install y zlib yum install y gccyum安裝 yum install y ...

sqlparse(未完待續)

sqlparse.split sql,encoding none sql 包含乙個或多個sql語句的字串 encoding 語句的編碼 可選 sql select from foo select from bar sql list sqlparse.split sql print sql list ...

標準庫型別vector(未完待續)

標準庫vector表示物件的集合,其中所有物件的型別都相同。集合中的每個物件都有乙個與之對應的索引,索引用於訪問物件。因為vector 容納著 其他物件 所以它也常被稱為 容器 想使用vector,必須包含適當的標頭檔案。如下 includeusing namespace std c 語言既有類模板...