大資料第二次作業

2022-10-05 05:15:10 字數 1075 閱讀 9554

檢查基礎環境hadoop,jdk

配置檔案

環境變數

執行python**

2.python程式設計練習

準備文字

讀檔案預處理:大小寫,標點符號,停用詞分詞

統計每個單詞出現的次數

按詞頻大小排序

結果寫檔案

with open("

data.txt

", "r"

) as f:

text=f.read()

text =text.lower()

for ch in

'!@#$%^&*(_)-+=\\}

for word in

afterwords:

counts[word] = counts.get(word,0) + 1items =list(counts.items())

items.sort(key=lambda x:x[1],reverse=true)

#輸出前10

for i in range(10):

word, count =items[i]

print("

".format(word, count)) #

列印前十個元素

搜尋複製

第二次作業

execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...

第二次作業

第一題 p1 1 遞迴寫法,效率低 include 1.寫乙個函式返回引數值為1的個數 比如 15 0000 1111 4個1 程式原型 int count one bits unsigned int value int fuc int x else return 0 void mainp1 p1 ...

第二次作業

檔名稱 516.cpp 作 者 闕文榮 完成日期 2016 年 3 月 11 日 版 本 號 v1.1 對任務及求解方法的描述部分 用while語句控制輸出 輸入描述 略 問題描述 現在北京有一套房子,200萬,假設房價每年 10 乙個軟體工程師每年固定能賺40萬。他想買這套房子,多大的 率能夠忍受...