Python詞頻對比並匯入CSV檔案

2022-09-12 05:57:15 字數 1749 閱讀 5560

需要用到的停用詞庫我上傳到我的資源了,大家也可以自己去網上找!

本來是想把兩個詞頻統計放入乙個csv檔案中,但是無奈向已經存在的csv檔案中追加寫入資料只能在已經存在的資料下面追加,也就是在同一列追加,不能另起一列新增資料,哪位兄弟懟出來了,歡迎回覆或私信!

import jieba

import pandas as pd

import csv

import codecs

# num=jieba.lcut("中國是乙個偉大的國家") # jieba庫的測試

# print(num)

# 計算機專業的-1.txt

txt1=open("計算機專業.txt").read()

# 匯入停用詞庫,過濾掉那些沒用的詞語,甚至都不是詞語,比如標點符號,停用詞在我的資源中有儲存

stopwords=[line.strip() for line in open("停用詞.txt").readlines()]

words1=jieba.lcut(txt1)

# print(words1)

counts1={}

for word1 in words1:

if len(word1)==1:

continue

else:

counts1[word1]=counts1.get(word1,0)+1

items1=list(counts1.items())

items1.sort(key=lambda x:x[1],reverse=true) # 根據詞頻進行降序排序

# print(items1)

file_csv=open("計算機專業詞頻.csv",'w+',newline='') #新增newline='',可以刪除每行之間的空行

writer=csv.writer(file_csv)

writer.writerow(["詞彙","詞頻"])

for data in items1:

writer.writerow(data)

file_csv.close()

# 法學專業的-2.txt

txt2=open("法學專業.txt").read()

words2=jieba.lcut(txt2)

counts2={}

for word2 in words2:

if len(word2)==1:

continue

else:

counts2[word2]=counts2.get(word2,0)+1

items2=list(counts2.items())

items2.sort(key=lambda x:x[1],reverse=true)

#print(items2)

# dataframe=pd.dataframe()

# dataframe.to_csv("test.csv")

# file_csv=open('test.csv','a')

file_csv=open("法學專業詞頻.csv",'w+',newline='')

writer=csv.writer(file_csv)

writer.writerow(["詞彙","詞頻"])

for data in items2:

writer.writerow(data)

file_csv.close()

Python 3 6 list對比並輸出差異

y t 2列資料對比,輸出 t中的新增元素存放到txt檔案中 coding utf 8 importos yesterdaynamelist todaynamelist differentnamelist areceivername test 讀取 昨天生成的 namelist 檔案 並生成 tod...

oracle9i sqlldr匯入csv檔案示例

參考 1.資料檔案d data test.csv,內容如下 13811399900,13814637554,2010 01 03 00 20 23,0.82,0.89,1.71 13811399900,13817776540,2010 01 03 20 07 03,0.68,0.32,1.0 138...

python中csv檔案處理 讀寫csv檔案

1.讀取csv檔案 import csv with open stock.csv r as fp reader csv.reader fp reader是乙個迭代器,可以進行遍歷 titles next reader for x in reader print x 0 print x 1 print...