gensim庫的一些使用

2021-09-12 21:28:47 字數 437 閱讀 2789

1、gensim.models.word2vec

1)訓練出模型

2)兩詞的相似度

3)某個詞的相關詞

4)好-壞,美-醜,找出某個詞的對應詞

5)從幾個詞中尋找不合群的詞

6)匯出詞向量

模型的訓練,依據分詞後的預料文字

2、gensim.corpora.dictionar

1)gensim.corpora.dictionar 生成詞典

2)doc2bow,詞袋模型,句中每個詞的(id,詞頻)

3)生成句中每個詞的(id,tf-idf)。根據每個文件的tfidf,計算新文件與語料庫中文件的相似度

4)潛在語義索引(lsi)。將語料庫中文件劃分出幾個主題,生成文件與主題的相關程度。

5)利用lda做主題分類的情況。將語料庫中文件劃分出幾個主題,生成文件與主題的相關程度。

python中numpy庫的一些使用

想不用第三方庫實現點深度學習的基礎部分,發現numpy真的好難 笑 在此做點遇到的函式的筆記 慣例官方文件 但真的屬實弟弟排版。以下都以import numpy as np為前提。1.np.zip 作用 該函式以多個可迭代的型別資料為輸入,如字典 列表和元組,從這些迭代型別中各取其乙個值,組成新的乙...

urllib庫的一些基本函式的使用

是python自帶的標準庫,無需另外安裝 可以模擬瀏覽器向指定的伺服器傳送請求並儲存返回的資料 在 urllib 庫中,所有與網路請求相關的函式都在 request 模組下 第一行 使用函式 urlopen 時需先導入 request 模組 第二行 建立乙個遠端url的類檔案物件,它的返回值是htt...

Android gridview 使用的一些小問題

1.gridview 水平滑動,網上有很多的介紹,比如 其中我認為對gridview 的 android layout width的設定是比較關鍵的 我是把它設定為乙個定值 例如1000dp 才能夠正常顯示的,其他情況下顯示不出來。2.對於gridview 某一項 子view 的獲取,使用getch...