python 實現文章內容統計

2021-09-26 13:44:05 字數 688 閱讀 9016

實現對目標檔案所有字元統計,單獨不重複字元統計,並通過字典列印以及寫入excel,以檔案的形式輸出統計的結果。

data = read() # data 為 read()返回的結果

generate_excel(data) # generate_excel 函式傳入引數 data

# for key, value in data.items():

# print(key+':'+str(value))

pass

def read():

list1 = {} # 定義乙個空字典

text = open(r'./27.txt', mode='rt', encoding='gbk').read()

# 開啟目標檔案 路徑為當前資料夾下 mode為模式 encoding為編碼格式

# .read()函式為對開啟的檔案進行讀操作

文章內容相關性統計

文章內容相關性統計 左直拳內容相關性我能想到的是比較兩篇文章提取出來的標籤。每篇文章都可以提取出一些出現頻率比較高的詞語,就是標籤,存放在資料庫裡。並且存放的時候已經按出現頻率從高到低排列,頻率高的標籤儲存在前面,低的在後面。假定標籤表結構如下 pagetag 字段含義 型別id inttagid ...

文章內容相關性統計

文章內容相關性統計 左直拳內容相關性我能想到的是比較兩篇文章提取出來的標籤。每篇文章都可以提取出一些出現頻率比較高的詞語,就是標籤,存放在資料庫裡。並且存放的時候已經按出現頻率從高到低排列,頻率高的標籤儲存在前面,低的在後面。假定標籤表結構如下 pagetag 字段含義 型別id inttagid ...

jquery實現文章內容展開收縮

小蝸牛問媽媽 為什麼我們從生下來,就要揹負這個又硬又重的殼呢?媽媽 因為我們的身體沒有骨骼的支撐,只能爬,又爬不快。所以要這個殼的保護!小蝸牛 毛蟲姊姊沒有骨頭,也爬不快,為什麼她卻不用背這個又硬又重的殼呢?媽媽 因為毛蟲姊姊能變成蝴蝶,天空會保護她啊。小蝸牛 可是蚯蚓弟弟也沒骨頭爬不快,也不會變成...