Pandas筆記 DataFrame基本操作

2022-08-02 03:54:09 字數 3164 閱讀 1302

import

numpy as np

import

pandas as pd

data = np.random.normal(0, 1, (10, 5))

index = ["

**{}

".format(i) for i in range(10)]

date = pd.date_range(start="

20180101

", periods=5, freq="b"

)data_pd = pd.dataframe(data, index, date) #

列:index 行:date 資料:data

print("

------------------顯示生成的資料:index,date,data-------------------")

print(data_pd.head()) #

獲取前5行資料

print("

------------------轉置並獲取前3行資料---------------------------------")

print(data_pd.t.head(3))

print("

------------------顯示後面5行資料-------------------------------------")

print

(data_pd.tail())

print("

------------------設定索引------------------------------------------")

print

(data_pd.index)

print("

------------------重設索引-------------------------------------")

print(data_pd.reset_index(drop=false).head())

執行結果:

------------------顯示生成的資料:index,date,data-------------------

2018-01-01 2018-01-02 2018-01-03 2018-01-04 2018-01-05**0 -1.506607 0.858618 -1.000629 -0.797692 -0.775486**1 1.029000 0.257812 -0.603442 1.181301 0.831904**2 0.793368 1.294983 0.114872 0.637446 0.929683**3 -0.242412 -0.202032 -1.355949 1.135424 2.406216**4 1.042224 -0.465189 -3.235827 0.438931 0.366087

------------------轉置並獲取前3行資料---------------------------------**0 **1 **2 ... **7 **8 **9

2018-01-01 -1.506607 1.029000 0.793368 ... -0.590076 0.272599 0.294911

2018-01-02 0.858618 0.257812 1.294983 ... 0.860489 -0.155215 -1.366205

2018-01-03 -1.000629 -0.603442 0.114872 ... -0.072485 -0.010132 0.260509[3 rows x 10columns]

------------------顯示後面5行資料-------------------------------------

2018-01-01 2018-01-02 2018-01-03 2018-01-04 2018-01-05**5 -0.916197 0.495509 -0.138883 0.815526 -0.288074**6 -0.145641 -2.434759 -0.484725 0.805658 1.682301**7 -0.590076 0.860489 -0.072485 -1.134887 -0.700504**8 0.272599 -0.155215 -0.010132 2.404830 -1.011119**9 0.294911 -1.366205 0.260509 0.879498 0.619766

------------------設定索引------------------------------------------index([

'**0

', '

**1', '

**2', '

**3', '

**4', '

**5', '

**6', '

**7', '

**8', '

**9'], dtype='

object')

------------------重設索引-------------------------------------index 2018-01-01 00:00:00 ... 2018-01-04 00:00:00 2018-01-05 00:00:000 **0 -1.506607 ... -0.797692 -0.775486

1 **1 1.029000 ... 1.181301 0.831904

2 **2 0.793368 ... 0.637446 0.929683

3 **3 -0.242412 ... 1.135424 2.406216

4 **4 1.042224 ... 0.438931 0.366087[5 rows x 6columns]

Pandas統計分析基礎之DataFrame

3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...

Spark 解析XML檔案到DataFrame

公司遇到一點需求,平時load檔案基本上都是csv格式的檔案,可是就有那麼乙個檔案是xml檔案,這也正常,因為檔案是別的team推過來的,自然要遵循他們的格式,於是就要想辦法解析xml檔案。目標是把xml檔案轉換為dataframe,然後寫到表中。可是spark.reader並沒有讀取xml格式檔案...

Pandas學習筆記 Pandas概覽(一)

pandas是python的核心資料分析支援庫,提供了快速 靈活 明確的資料結構,旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的,大小可變的,二維異構 pandas資料結構就像是低維資...