jieba的簡單使用

2021-08-25 11:08:44 字數 844 閱讀 9466

直接上**吧:

# -*- coding: utf-8 -*

import jieba

import jieba.posseg as pseg

import os,sys

from sklearn import feature_extraction

from sklearn.feature_extraction.text import tfidftransformer

from sklearn.feature_extraction.text import countvectorizer

if __name__ == '__main__':

corpus=["我 來到 北京 清華大學",

"他 來到 網易 杭研 大廈",

"小明 碩士 畢業 於 中國 科學院",

"我 愛 北京 天安門"]

vectorizer=countvectorizer()

transformer=tfidftransformer()

tfidf=transformer.fit_transform(vectorizer.fit_transform(corpus))

word=vectorizer.get_feature_names()

weight=tfidf.toarray()

for i in range(len(weight)):

print(u"--------這裡輸入第",i,u"類文字的詞語tf-idf權重-----")

for j in range(len(word)):

print(word[j],weight[i][j])

python的jieba簡單使用

函式 含義jieba.cut string 精確模式,返回乙個可迭代的資料型別 jieba.cut string,cut all true 全模式,輸出文字string中的所有可能的單詞 jieba.cut for search string 搜尋引擎模式,適合搜尋引擎建立索引的分詞結果 jieba...

python中的jieba簡單使用

jieba常用三個函式 jieba.lcut x jieba.lcut x,cut all true jieba.lcut for rearch x 練習 import jieba s 中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好 生活需要和不平衡不從分的發展之間的矛盾。...

jieba安裝與簡單使用

windows 下使用命令安裝 在聯網狀態下,在命令列下輸入 pip install jieba 進行安裝,安裝完成後會提示安裝成功 在 pycharm 中安裝 開啟 settings,搜尋 project interpreter,在右邊的視窗選擇 號,點選後在搜尋框搜尋 jieba,點選安裝即可 ...