深入理解Series和DataFrame

2021-10-01 04:26:47 字數 4448 閱讀 9833

series和dataframe上手都很容易,但是深入理解一下還是有必要的——磨刀不誤砍柴工嘛

import pandas as pd
df = pd.read_clipboard(

)

開啟國家統計局網頁,複製乙個**,然後讀取貼上板,easy

df

指標地區

資料時間

數值所屬欄目

相關報表

0居民消費**指數(上月=100)

全國2023年10月

100.9

月度資料

相關報表

1居民消費**指數(上月=100)

全國2023年10月

nan月度資料

相關報表

2居民消費**指數(1978=100)

全國2023年

650.9

年度資料

相關報表

3居民消費**指數(1978=100)

全國2023年

637.5

年度資料

相關報表

4居民消費**指數(上年同月=100)

全國2023年10月

103.8

月度資料

相關報表

5居民消費**指數(上年同月=100)

全國2023年10月

nan月度資料

相關報表

6居民消費**指數(上年同期=100)

全國2023年10月

102.6

月度資料

相關報表

7居民消費**指數(上年同期=100)

全國2023年10月

nan月度資料

相關報表

8居民消費**指數(上年=100)

全國2023年

102.1

年度資料

相關報表

9居民消費**指數(上年=100)

全國2023年

101.6

年度資料

相關報表

10城市居民消費**指數(上年同月=100)

全國2023年10月

103.5

月度資料

相關報表

11城市居民消費**指數(上年同月=100)

全國2023年10月

nan月度資料

相關報表

空值對資料分析是沒有意義的,我們先去掉

df1 = df.dropna(axis=

0)

df1

指標地區

資料時間

數值所屬欄目

相關報表

0居民消費**指數(上月=100)

全國2023年10月

100.9

月度資料

相關報表

2居民消費**指數(1978=100)

全國2023年

650.9

年度資料

相關報表

3居民消費**指數(1978=100)

全國2023年

637.5

年度資料

相關報表

4居民消費**指數(上年同月=100)

全國2023年10月

103.8

月度資料

相關報表

6居民消費**指數(上年同期=100)

全國2023年10月

102.6

月度資料

相關報表

8居民消費**指數(上年=100)

全國2023年

102.1

年度資料

相關報表

9居民消費**指數(上年=100)

全國2023年

101.6

年度資料

相關報表

10城市居民消費**指數(上年同月=100)

全國2023年10月

103.5

月度資料

相關報表

指定axis引數是常見操作,0代表效果產生於行,1代表效果產生於列

seri1 = df1[

'指標'

]

seri2 = df1[

'資料時間'

]seri3 = df1[

'數值'

]

seri1
0         居民消費**指數(上月=100)

2 居民消費**指數(1978=100)

3 居民消費**指數(1978=100)

4 居民消費**指數(上年同月=100)

6 居民消費**指數(上年同期=100)

8 居民消費**指數(上年=100)

9 居民消費**指數(上年=100)

10 城市居民消費**指數(上年同月=100)

name: 指標, dtype: object

nw_df = pd.dataframe(

[seri1,seri2,seri3]

)

nw_df
02

3468

910指標居民消費**指數(上月=100)

居民消費**指數(1978=100)

居民消費**指數(1978=100)

居民消費**指數(上年同月=100)

居民消費**指數(上年同期=100)

居民消費**指數(上年=100)

居民消費**指數(上年=100)

城市居民消費**指數(上年同月=100)

資料時間

2023年10月

2023年

2023年

2023年10月

2023年10月

2023年

2023年

2023年10月

數值100.9

650.9

637.5

103.8

102.6

102.1

101.6

103.5

nw_df.t

指標資料時間數值0

居民消費**指數(上月=100)

2023年10月

100.9

2居民消費**指數(1978=100)

2023年

650.9

3居民消費**指數(1978=100)

2023年

637.5

4居民消費**指數(上年同月=100)

2023年10月

103.8

6居民消費**指數(上年同期=100)

2023年10月

102.6

8居民消費**指數(上年=100)

2023年

102.1

9居民消費**指數(上年=100)

2023年

101.6

10城市居民消費**指數(上年同月=100)

2023年10月

103.5

dic =

df2 = pd.dataframe(dic)
df2

張三李四王五0

6056781

合格不及格

良好

df2.t
01

張三60

合格李四

56不及格

王五78良好

從上我們看到series和dict可以互相轉換,但是兩者資訊量不是完全對稱的

nw_df = pd.dataframe([[

'張',

'王',

'李'],[

34,56,

67],[

'不及格'

,'不及格'

,'及格']]

)

nw_df
01

20張王

李13456672

不及格不及格

及格

df4 = pd.dataframe([,

,,])

df4

姓名成績評級0

錢謙益34

不及格1

李瓊67及格2

譚耀祖97

優秀

深入理解C語言 深入理解指標

關於指標,其是c語言的重點,c語言學的好壞,其實就是指標學的好壞。其實指標並不複雜,學習指標,要正確的理解指標。指標也是一種變數,占有記憶體空間,用來儲存記憶體位址 指標就是告訴編譯器,開闢4個位元組的儲存空間 32位系統 無論是幾級指標都是一樣的 p操作記憶體 在指標宣告時,號表示所宣告的變數為指...

mysql 索引深入理解 深入理解MySql的索引

為什麼索引能提高查詢速度 先從 mysql的基本儲存結構說起 mysql的基本儲存結構是頁 記錄都存在頁裡邊 各個資料頁可以組成乙個雙向鍊錶每個資料頁中的記錄又可以組成乙個單向鍊錶 每個資料頁都會為儲存在它裡邊兒的記錄生成乙個頁目錄,在通過主鍵查詢某條記錄的時候可以在頁目錄中使用二分法快速定位到對應...

深入理解C語言 深入理解指標

關於指標,其是c語言的重點,c語言學的好壞,其實就是指標學的好壞。其實指標並不複雜,學習指標,要正確的理解指標。指標也是一種變數,占有記憶體空間,用來儲存記憶體位址 指標就是告訴編譯器,開闢4個位元組的儲存空間 32位系統 無論是幾級指標都是一樣的 p操作記憶體 在指標宣告時,號表示所宣告的變數為指...