《python語言程式設計基礎》 第6章

2021-10-09 08:16:31 字數 1345 閱讀 4854

根據資料之間的關係,組合資料型別可以分為3類:序列型別(元素之間存在先後關係,通過序號訪問,元素之間可以是相通的)、集合型別(元素無序,且相同元素在集合中唯一存在)、對映型別(即鍵值對)。

這個庫的名字挺有趣!

jieba是python中乙個重要的第三方中文分詞函式庫。

jieba庫的分詞原理是利用乙個中文詞庫,將待分詞的內容與分詞詞庫進行比對,通過圖結構和動態規劃方法找到最大概率的片語。除了分詞,jieba還提供增加自定義中文單詞的功能。

jieba庫支援3中分詞模式:精確模式,將句子最精確地切開,適合文字分析(輸出的分詞能夠完整並且不多餘的組成原始文字);全模式,把句子中所有可以成詞的詞語都掃瞄出來,冗餘性大,速度非常快,但是不能消除歧義;搜尋引擎模式,在精確模式的基礎上,對長詞再次切分,提高召回率,適合用於搜尋引擎分詞。

import jieba

jieba.cut(

'結巴庫學習'

)#jieba.cut()是精確模式,返回乙個可以迭代的資料型別

print

(type

(jieba.cut(

'結巴庫學習'))

)##執行結果是

jieba.lcut(

)##精確模式,返回乙個列表型別,建議使用

jieba.cut(

'結巴庫學習'

, cut_all=

true

)#全模式,輸出文字s中所有可能的單詞

#全模式,把句子中所有可以成詞的詞語都掃瞄出來,速度非常快,但是不能消除歧義

jieba.lcut(

'字串'

, cut_all=

true

)##全模式,返回乙個列表型別,建議使用

jieba.lcut_for_search(

'字串'

)##搜尋引擎模式,返回乙個列表型別,建議使用

jieba.add_word(

'單詞'

)##向分詞字典中增加新詞

##也就是建議使用的是lcut及其相關衍生

python程式設計 第6章

學習django book的可以參照下面的資訊。在mysite下面建立完books後,繼續按著例子走,出現以下問題 pytho manage.py validate error one or more models did not validate books.author headshot to ...

《Go程式語言》 第6章

6.1 方法宣告 方法的宣告和普通函式的宣告類似,只是在函式名前多了乙個引數。這個引數把方法繫結到這個引數對應的型別上。import math type point struct 普通函式 func distance p,q point point型別的方法 p是方法的接收者,主調函式或方法,通過d...

C語言程式設計 第6章

參考例6.4程式,程式設計計算並輸出1到n之間的所有數的平方和立方。其中,n值由使用者從鍵盤輸入。include include intmain return0 某人在國外留學,不熟悉當地天氣預報中的華氏溫度值,請程式設計按每隔10 輸出0 到300 之間的華氏溫度到攝氏溫度的對照表,以方便他對照查...