python資料分析小專案練習

2021-09-18 01:49:52 字數 3475 閱讀 6083

資料來源:

小練習import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

plt.rcparams[『font.sans-serif』]=[『simhei』] #用來正常顯示中文標籤,否則中文顯示方塊

plt.rcparams[『axes.unicode_minus』]=false #用來正常顯示負號

data_src = "titanic-data.csv"

df = pd.read_csv(data_src,header=0)

print(df)

# print(df.info())

# print(df.describe())

# print(df.head())

#對於少量缺失值的情況,常用的方法是去除和補齊

#對於存在大量缺失值的字段,應衡量此字段的重要程度與修復代價之間的權重

#計算存活率

survived_rate = float(df["survived"].sum()) / df["survived"].count()

print(survived_rate)

#船艙位和存活率的關係

x =

y =

# print(df[(df.pclass==1)]["pclass"])#取pclass=1列人數

x1 = df[(df.pclass==1)]["pclass"].size

x2 = df[(df.pclass==2)]["pclass"].size

x3 = df[(df.pclass==3)]["pclass"].size

# print(x)

#計算各船艙存活人數

#分類計算存活率

pclass_survived_rate = (df.groupby(["pclass"]).sum() / df.groupby(["pclass"]).count()) ["survived"]

# print(pclass_survived_rate)

pclass_survived_rate.plot(kind="bar")

# plt.bar(x=[1,2,3],height=pclass_survived_rate,color="lightgreen")

# plt.text(x+0.05,y+0.05,ha="center")#加標籤---失敗

plt.title("各船艙生存率")

plt.show()

print("################################")

#一等艙存活率高

#性別的影響

***_survived_rate = (df.groupby(["***"]).sum() / df.groupby(["***"]).count()) ["survived"]

***_survived_rate.plot(kind="bar")

plt.title("性別影響")

#哪個年齡段存活率高

age_survived_rate = (df.groupby(["age"]).sum() / df.groupby(["age"]).count()) ["survived"]

age_survived_rate.plot()

plt.title("年齡&存活率關係")

#年齡中有未知的,先進行資料清洗

# print((df['age']).count())

age_clean_date = df[~np.isnan(df["age"])]#去掉age為空的行

# print(age_clean_date["age"])

ages = np.arange(0,81,5)

age_cut = pd.cut(age_clean_date.age,ages)

age_cut_grouped = age_clean_date.groupby(age_cut)

age_survived_rate = (age_cut_grouped.sum()/age_cut_grouped .count()) ["survived"]

age_survived_rate.plot(kind="bar")

plt.title("各年齡段存活率")

plt.show()

#結果發現老人和小孩存活率較高,常識!

#多因素影響

pclass_***_survived_rate=(df.groupby(['***','pclass']).sum()/df.groupby(['***','pclass']).count())['survived']

pclass_***_survived_rate.plot(kind='bar')

plt.title('性別和船艙位與存活率關係')

plt.show()

#生死關頭也要保持紳士風度!!

python小專案一 NBA比賽資料分析

該專案 於實驗樓,我這裡只是記錄下自己做完專案的筆記和總結 實驗樓是py2的 我則是用的py3 專案目的 通過分析之前的比賽資料,得到每個隊伍的狀態的特徵表達,利用機器學習訓練回歸模型,從而對新的比賽進行 為了掌握並實現這個專案,需了解一下幾個問題 1.如何讀取資料夾中的資料?答 這個專案的資料儲存...

經典python基礎小專案練習

3.公升級題 實現乙個整數加法計算器 多個數相加 如 content input 請輸入內容 使用者輸入 5 9 6 12 13,然後進行分割再進行計算。content input 請輸入內容 print content listvar content.split print listvar res...

while 小專案練習

1 用雙層while 寫十行十列小星星 j 0 while j 10 列印一行十個小星星 i 0 while i 10 print end i 1 列印換行 print j 1 2 用雙層while 寫十行十列隔列換色小星星 變數i控制的是列 j 0 while j 10 列印一行十個小星星 變數i...