Pandas資料結構之Series

2021-09-10 18:37:12 字數 2074 閱讀 8144

import pandas as pd

#series類

#生成series類的方法:1.

obj = pd.series([4, 7, -5, 3])

obj2 = pd.series([4, 7, 5, -3], index=['a', 'b', 'c', 'd'])

print(obj2.values, obj2.index)

print(obj2['a'])

print(obj2[['c', 'a', 'd']]) #必須要加兩層中括號

print(obj[obj > 0])

print(obj2[obj2 > 0])

#2.直接使用字典生成series

sdata =

obj3 = pd.series(sdata)

print(obj3)

states = ['california', 'ohio', 'oregon', 'texas']

obj4 = pd.series(sdata, index=states)

print(obj4)

#nan標記缺失值的方式

print(obj4.isnull())

print(obj4.notnull())

print(obj3+obj4)#相當於資料庫中的join操作

#給series物件及其索引進行命名

obj4.name = 'population'

obj4.index.name = 'state'

print(obj4)

obj.index = ['bob', 'steve', 'jeff', 'ryan']

print(obj)

[ 4  7  5 -3] index(['a', 'b', 'c', 'd'], dtype='object')

4c 5

a 4

d -3

dtype: int64

0 4

1 7

3 3

dtype: int64

a 4

b 7

c 5

dtype: int64

ohio 35000

oregon 16000

texas 71000

utah 5000

dtype: int64

california nan

ohio 35000.0

oregon 16000.0

texas 71000.0

dtype: float64

california true

ohio false

oregon false

texas false

dtype: bool

california false

ohio true

oregon true

texas true

dtype: bool

california nan

ohio 70000.0

oregon 32000.0

texas 142000.0

utah nan

dtype: float64

state

california nan

ohio 35000.0

oregon 16000.0

texas 71000.0

name: population, dtype: float64

bob 4

steve 7

jeff -5

ryan 3

dtype: int64

pandas資料結構之Series

series 是一種類似於一維陣列的物件,它由一組資料和一組與之相關的資料標籤 lable 或者說索引 index 組成。現在我們使用series生成乙個最簡單的series物件,因為沒有給series指定索引,所以此時會使用預設索引 從0到n 1 from pandas import series...

pandas資料結構之Dataframe

綜述 numpy主要用於進行運算 dataframe更切合於業務邏輯 dataframe的常用的屬性 屬性 說明 shape dataframe的形狀 values dataframe的值,numpy.ndarray index 行索引 index.name 行索引的名字 columns 列索引 c...

pandas資料結構之DataFrame筆記

dataframe輸出的為表的形式,由於要把輸出的 貼上來比較麻煩,在此就不在貼出相關輸出結果,在jupyter notebook可以順利執行 中有相關解釋用來加深理解方便記憶1 import numpy as np 2import pandas as pd 34 d 67 df pd.datafr...