第二次作業

2022-10-08 16:30:29 字數 1335 閱讀 1163

一、安裝spark

二、python程式設計練習:英文文字的詞頻統計

# 1匯入模組

# 匯入字串模組

import

string

# 2讀取檔案,並分詞

list_dict ={} # 建立乙個空字典,放詞頻與單詞,無序排列

data = # 建立乙個空列表,放詞頻與單詞,有序:從多到少

f = open('

zhb.txt

', '

r', encoding="

utf-8

") # 開啟檔案

content =f.read() # 讀取檔案

f.close() # 關閉檔案

content = content.replace('

-', '

') # 連字元—用空格代替

words = content.split() # 字串按空格分割--分詞

# 迭代處理:將字典變列表,存入資料

for i in

range(len(words)):

words[i] = words[i].strip(string

.punctuation) # 去掉標點符號,去掉首尾

words[i] =words[i].lower() # 統一大小寫

if words[i] in

list_dict: # 統計詞頻與單詞

list_dict[words[i]] = list_dict[words[i]] + 1

# 不是第一次

else

: list_dict[words[i]] = 1

# 第一次

# print(list_dict) # 列印字典(詞頻與單詞,無序)

# 遍歷字典

for key, value in

list_dict.items(): # 遍歷字典

temp =[value, key] # 變數,變數值

data.sort(reverse=true) # 排序

print(data) # 列印列表(詞頻與單詞,有序,從多到少)file2.close()

第二次作業

execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...

第二次作業

第一題 p1 1 遞迴寫法,效率低 include 1.寫乙個函式返回引數值為1的個數 比如 15 0000 1111 4個1 程式原型 int count one bits unsigned int value int fuc int x else return 0 void mainp1 p1 ...

第二次作業

檔名稱 516.cpp 作 者 闕文榮 完成日期 2016 年 3 月 11 日 版 本 號 v1.1 對任務及求解方法的描述部分 用while語句控制輸出 輸入描述 略 問題描述 現在北京有一套房子,200萬,假設房價每年 10 乙個軟體工程師每年固定能賺40萬。他想買這套房子,多大的 率能夠忍受...