Datawhale之動手學資料分析第二章(二)

2021-10-23 17:32:27 字數 2015 閱讀 6109

list_up = [text_left_up,text_right_up] 

result_up = pd.concat(list_up,axis=1)

result_up.head()

list_down=[text_left_down,text_right_down] 

result_down = pd.concat(list_down,axis=1)

result = pd.concat([result_up,result_down])

result.head()

resul_up = text_left_up.join(text_right_up) 

result_down = text_left_down.join(text_right_down)

result.head()

result_up = pd.merge(text_left_up,text_right_up,left_index=true,right_index=true) result_down=pd.merge(text_left_down,text_right_down,left_index=true,right_index=true) 

result.head()

result.to_csv('result.csv')
# 將完整的資料載入出來

text = pd.read_csv('result.csv') text.head()

# **寫在這裡

unit_result=text.stack().head(20)

unit_result.head()

#將**儲存為unit_result.csv

unit_result.to_csv('unit_result.csv')

test = pd.read_csv('unit_result.csv')

test.head()

df = text['fare'].groupby(text['***']) 

means = df.mean()

means

survived_*** = text['survived'].groupby(text['***']).sum()

survived_***.head()

survived_pclass = text['survived'].groupby(text['pclass'])

survived_pclass.sum()

text.groupby(['pclass','age'])['fare'].mean().head()
result = pd.merge(means,survived_***,on='***')

result

result.to_csv('***_fare_survived.csv')

#不同年齡的存活人數

survived_age = text['survived'].groupby(text['age']).sum()

survived_age.head()

#找出最大值的年齡段

survived_age[survived_age.values==survived_age.max()]

_sum = text['survived'].sum()

print(_sum)

#首先計算總人數

_sum = text['survived'].sum()

print("sum of person:"+str(_sum))

precetn =survived_age.max()/_sum

print("最大存活率:"+str(precetn))

Datawhale之動手學資料分析第一章

step1 匯入numpy pandas庫 step2 載入資料 1.1檢視資料的基本資訊 df.info 1.2觀察dataframe物件的前n行 後n行 df.head n df.tail 1.3判斷資料是否為空,為空的地方返回true,其餘地方返回false df.isnull head 1....

動手學資料分析之「資料重構」

在資料分析中,原始的資料往往比較紛繁複雜,特徵不突出,使用起來不方便,這種時候我們可以通過一定的資料重構手段,比如資料合併和資料聚類及資料重塑,來幫助我們將資料重構為更適合分析的形式,這就是資料重構的作用。pandas庫中的資料合併方法有merge 函式,concat 函式,以及join 函式。簡而...

動手學深度學習

線性回歸的基本要素 模型 為了簡單起見,這裡我們假設 只取決於房屋狀況的兩個因素,即面積 平方公尺 和房齡 年 接下來我們希望探索 與這兩個因素的具體關係。線性回歸假設輸出與各個輸入之間是線性關係 price warea area wage age b price warea area wage a...