pandas學習筆記 三

2021-10-05 08:23:59 字數 4452 閱讀 4012

import pandas as pd

import numpy as np

data = pd.read_csv(

'student.csv'

)data.head(

)

學號姓名

班級年齡

01.0

小明1.0

7.01

2.0小華

1.06.0

23.0

小紅2.0

6.03

4.0小麗

3.08.0

45.0

無名氏2.0

99.0

data = pd.read_csv(

'student.csv'

,header=

none

)data.head(

)

01

230學號

姓名班級年齡1

001小明17

2002小華1

63003小紅26

4004小麗3

8

data = pd.read_excel(

'test.xlsx'

)data.head(

)

學號姓名

班級年齡01

小明171

2小華16

23小紅2

634小麗

38

# 指定分隔符為  ,

data = pd.read_table(

'student.csv'

,sep=

',')

data.head(

)

學號姓名

班級年齡

01.0

小明1.0

7.01

2.0小華

1.06.0

23.0

小紅2.0

6.03

4.0小麗

3.08.0

45.0

無名氏2.0

99.0

data = pd.read_csv(

'student.csv'

,skiprows=[1

,2])

data.head(

)

學號姓名

班級年齡

03.0

小紅2.0

6.01

4.0小麗

3.08.0

25.0

無名氏2.0

99.0

3nan

nannan

nan4

7.0曹操

0.0100.0

data = pd.read_table(

'student.csv'

,sep=

',',na_values=

['null'])

data

學號姓名

班級年齡

01.0

小明1.0

7.01

2.0小華

1.06.0

23.0

小紅2.0

6.03

4.0小麗

3.08.0

45.0

無名氏2.0

99.0

5nan

nannan

nan6

7.0曹操

0.0100.0

#進行顯示設定

pd.options.display.max_rows =

5

#讀取檔案一小部分 例5行

data = pd.read_csv(

'student.csv'

,nrows=5)

data

學號姓名

班級年齡01

小明17...

......

......45

無名氏299

5 rows × 4 columns

#分塊 指定一塊的行數

chunker = pd.read_csv(

'student.csv'

,chunksize=2)

chunker

#讀取塊中的資料

tot = pd.series(

)for piece in chunker:

tot = tot.add(piece[

'姓名'

].value_counts(

),fill_value=0)

tot = tot.sort_values(ascending=

false

)tot

曹操    1.0

...

小麗 1.0

length: 6, dtype: float64

with

open

('student.txt'

,'r'

,encoding=

'utf-8'

)as f:

line = f.readline(

)for i in f:

print

(i)

001,小明,1,7

002,小華,1,6

003,小紅,2,6

004,小麗,3,8

005,無名氏,2,99

,,,007,曹操,0,100

frame = pd.dataframe(

)store = pd.hdfstore(

'data.h5'

)store[

'obj1'

]= frame

store[

'obj1_col'

]= frame[

'a']

store[

'obj1'

]

a0

-0.362267

10.581715

......

98-0.873690

99-0.164074

100 rows × 1 columns

import pymysql

conn = pymysql.connect(host=

'localhost'

,user=

'root'

,password=

'19961021'

,db=

'student'

,charset=

'utf8'

)data_sql=pd.read_sql(

"select * from student"

,conn)

data_sql

學號姓名

年齡班級

0001小明7

11002小紅62

2003小華8

33004小麗105

data

學號姓名

班級年齡01

小明171

2小華16

23小紅2

634小麗

3845

無名氏2

99

data.to_csv(

'student-1.csv'

)

from sqlalchemy import create_engine

engine = create_engine(

"mysql+pymysql://{}:{}@{}/{}?charset={}"

.format

('root'

,'19961021'

,'127.0.0.1:3306'

,'student'

,'utf8mb4'))

con = engine.connect(

)#建立連線

#conns = pymysql.connect(host='localhost',user='root',password='19961021',db='student',charset='utf8')

data.to_sql(

name=

'student-1'

, con=con,

if_exists=

, index=

false

,)

pandas學習筆記(三)

生成乙個以2017 01開始,月為頻率的時間構造器 pd.period 引數 乙個時間戳 freq p pd.period 2017 freq m print p 通過加減整數,將週期整體移動 print p 1 print p 2 輸出 2017 01 2017 02 2016 11 prng p...

pandas基礎學習筆記三

二 groupby函式 三 聚合 過濾和變換 第3章 分組.經過groupby後會生成乙個groupby物件,該物件本身不會返回任何東西,只有當相應的方法被呼叫才會起作用 grouped single df.groupby school 根據某一列分組 grouped single.get grou...

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...