Pandas第4次作業

2021-10-18 22:13:25 字數 3229 閱讀 7797

將 學生成績表 與 選修成績表 進行水平的拼接

"""

created on wed feb 3 14:10:41 2021

@author: author: 清弦墨客(聆聽)

"""import numpy as np

import pandas as pd

# 隨機生成學生成績表

student_scores = pd.dataframe(np.random.randint(50,

100,16)

.reshape(4,

4), index=

["胡歌"

,"林更新"

,"金世佳"

,"醜娟"],

columns=

["語文"

,"數學"

,"英語"

,"python"])

#print(student_scores)

# 隨機生成學生選修成績表,並將部分成績設為nan

elective_scores = pd.dataframe(np.random.randint(60,

100,12)

.reshape(4,

3), index=

["胡歌"

,"林更新"

,"金世佳"

,"醜娟"],

columns=

["體育"

,"統計學"

,"日語"])

elective_scores[

"體育"

]= np.nan

elective_scores.loc[

"林更新"

:"金世佳"

,"統計學"

]= np.nan

elective_scores.loc[

["胡歌"

,"醜娟"],

"日語"

]= np.nan

#print(elective_scores)

# 學生成績表 和 選修成績表有共同的index,進行水平拼接

df_new = pd.concat(

[student_scores, elective_scores]

, axis=1)

print

(df_new)

"""

created on wed feb 3 14:10:41 2021

@author: author: 清弦墨客(聆聽)

"""import numpy as np

import pandas as pd

# 用pandas讀取xlxs檔案

path = r"d:\coding\python\logiccoding\data analyze\學生分配表.xlsx"

students = pd.read_excel(path)

#print(students)

path = r"d:\coding\python\logiccoding\data analyze\老師排班表.xlsx"

teachers = pd.read_excel(path)

#print(teachers)

# 比較資料,發現班級是共同的列

df_new = pd.merge(students, teachers, how=

"inner"

, on=

"班級"

)print

(df_new)

需求1:通過starbucks_store_worldwide.csv資料,分析是中美的分布情況

需求2:通過starbucks_store_worldwide.csv資料,獲取中國每個省份的分布數量

"""

created on wed feb 3 14:10:41 2021

@author: author: 清弦墨客(聆聽)

"""import numpy as np

import pandas as pd

path = r"d:\coding\python\logiccoding\data analyze\starbucks_store_worldwide.csv"

starbucks = pd.read_csv(path)

# 先篩選出所有starbucks的店鋪(因為還有別的品牌)

starbucks = starbucks[starbucks[

"brand"]==

"starbucks"

]# 再篩選出所有在美國的星巴克店鋪(美國**為us)

starbucks_us = starbucks[starbucks[

"country"]==

"us"

]print

(len

(starbucks_us)

)# 再篩選出所有在中國的星巴克店鋪(中國**為cn)

starbucks_cn = starbucks[starbucks[

"country"]==

"cn"

]print

(len

(starbucks_cn)

)# 結果顯示美國13311家,中國2734家,還是美國的多。

# 將篩選過的中國資料儲存一下,方便觀察,不儲存也行

path = r"d:\coding\python\logiccoding\data analyze\starbucks_china.xlsx"

starbucks_cn.to_excel(path,encoding=

"utf-8"

)# 使用groupby聚合,統計每個城市星巴克店的數量

starbucks_cn_group = starbucks_cn.groupby(by=

"city")[

"city"

].count(

)print

(starbucks_cn_group)

# 儲存結果

path = r"d:\coding\python\logiccoding\data analyze\starbucks_china_group.xlsx"

starbucks_cn_group.to_excel(path,encoding=

"utf-8"

)# 從統計結果來看,開店最多的地方是上海和香港

第4次作業

實踐最簡答的專案wordcount,必須完成其中的基本功能,若可以完成其他功能給予加分。完成後請將你的設計思路 主要 寫在本次作業部落格裡。要求三 學習總結和進度 30分 1 將pta作業的源 使用git提交到託管平台上,要求給出上傳成功截圖和你的git位址。請注意git位址應是類似 這樣的字串且是...

第4次作業

第一部分 先列出本次採用scrum敏捷程式設計的任務完成情況,並寫出心得 學生們丟東西的頻率越來越高,所以丟失東西之後找回就很重要,但是又比較難找回。我們的學生可以在平台上招領及尋找失物,以及發布招領資訊,為學生帶來了便捷。本次開發我們使用了scrum敏捷程式設計來完成此次任務,在團隊合作的時候提高...

c 第4次作業

專案3 乘法口訣表 程式設計序,輸出乙個乘法口訣表,形如 1x1 1 1x2 2 2x2 4 1x3 3 2x3 6 3x3 9 檔名稱 作 者 劉夢燕 完成日期 2016 年 4 月 24 日 版 本 號 v1.0 對任務及求解方法的描述部分 略 輸入描述 略 問題描述 略 程式輸出 略 問題分析...