第1章 Pandas基礎

2021-10-05 06:12:12 字數 2725 閱讀 2741

import pandas as pd

import numpy as np

import os

os.chdir(r'檔案目錄'

)//用os.chdir 進入指定檔案目錄,讀取相應檔案

df = pd.read_csv(

'data/table.csv'

)df_txt = pd.read_table(

'data/table.txt'

)df_excel = pd.read_excel(

'data/table.xlsx'

)df.to_csv(

'data/new_table.csv'

)df.to_excel(

'data/new_table2.xlsx'

, sheet_name=

'sheet1'

)

1.series

常用結構:

s = pd.series(np.random.randn(5)

,index=

['a'

,'b'

,'c'

,'d'

,'e'

],name=

'這是乙個series'

,dtype=

'float64'

)

2.dataframe

df = pd.dataframe(

, index=

list

('一二三四五'))

#呼叫方法

df.index df.columns df.values df.shape

df.mean(

)#列的刪除與新增

#刪除而言,可以使用drop函式或del或pop

```python

df.drop(index=

'五',columns=

'col1'

)#設定inplace=true後會直接在原dataframe中改動在這裡插入**片

del df[

'col1'

]df.pop(

'col1'

)df1.assign(c=pd.series(

list

('def'))

)//這裡會出現索引對齊問題,assign 是左連線

#新增新列可以用assign方法或者直接用list,但是assign不會對dataframe做修改

df1[

'b']

=list

('abc'

)df1.assign(c=pd.series(

list

('def'))

)#根據型別選擇列

df.select_dtypes(include=

['number'])

.head(

)#將series轉換為dataframe

s.name=

'to_dataframe'

s.to_frame(

)

常用基本函式

df[

'physics'

].nunique(

)#nunique顯示有多少個唯一值

df['physics'

].unique(

)#unique顯示所有的唯一值

df[

'physics'

].count(

)#返回非缺失值元素個數

df['physics'

].value_counts(

)#返回每個元素有多少個

df[

'math'

].idxmax(

)df[

'math'

].nlargest(

3)

df[

'math'

].clip(33,

80).head(

)#clip是對超過或者低於某些值的數進行截斷

df['address'

].replace(

['street_1'

,'street_2'],

['one'

,'two'])

.head(

)df.replace(})

.head(

)

df[

'math'].

(lambda x:

str(x)

+'!'

).head(

)#可以使用lambda表示式,也可以使用函式

df.set_index(

'math'

).head(

)df.set_index(

'math'

).sort_index(

).head(

)#可以設定ascending引數,預設為公升序,true

df.sort_values(by=

'class'

).head(

)df.sort_values(by=

['address'

,'height'])

.head(

)

1 第1章 Pandas基礎

1.5.2.5 練習二 現有乙份關於科比的投籃資料集,請解決如下問題 1.5.2.6 a 哪種action type和combined shot type的組合是最多的?df pd.read csv data kobe data.csv index col shot id df.head pd.se...

第1章 python基礎

1.1表示式 在pyhon中,2 2稱為表示式,是值 變數和操作符的組合。單獨的乙個值也被看做乙個表示式,單獨的變數也是如此。語句是一段會產生效果的 單元,如建立新變數或者顯示乙個值 n 17 print n 第一行是乙個賦值語句,將值17賦給變數n 第二行是乙個print語句,顯示變數n的值 區別...

第1章 設計模式基礎

在軟體開發中,經過驗證的,用於解決特定環境下 重複出現的 特定問題的解決方案。下面分別詳細描述每個限定詞。在軟體開發中 特指後面討論的設計模式僅限於軟體開發領域。其他領域 如建築行業 的設計模式不在本教程討論範圍內。特定環境 是指特定的應用上下文環境,脫離這個環境,這個設計模式有可能不成立或者適得其...