python高階 pandas教程(二)

2021-08-21 18:06:24 字數 3798 閱讀 7706

pandas資料結構(dataframe)

dataframe是乙個**型的資料結構,它含有一組有序的列,每列可以是不同的值型別(數值、字串、布林值),dataframe既有行索引也有列索引,可被看作是有series組成的字典。

1、建立dataframe

import pandas as pd

import numpy as np

# 建立dataframe

data =

dataframe1 = pd.dataframe(data=data) # 通過字典建立

dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])

dataframe3 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"], columns=["price"]) # 指定列索引

dataframe4 = pd.dataframe(data=np.arange(12).reshape(3, 4)) # 通過numpy陣列建立

2、查詢dataframe中的元素

data = 

dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])

frame_index = dataframe2.index # 查詢dataframe中的所有行標籤

frame_column = dataframe2.columns # 查詢dataframe中所有列標籤

frame_values = dataframe2.values # 查詢dataframe中的所有值

frame_value1 = dataframe2["color"]["index1"] # 索引查詢數值(先列後行)

frame_value2 = dataframe2.at["index1", "color"] # 索引查詢數值

frame_value3 = dataframe2.iat[0, 0] # 絕對位置查詢數值

3、查詢dataframe中某一行/列元素

data = 

dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])

# 查詢dataframe一行/列元素

frame_index_value1 = dataframe2.ix["index1"] # 查詢一行元素

frame_index_value2 = dataframe2.ix[0] # 查詢一行元素(絕對位置)

frame_index_value3 = dataframe2.loc["index1"] # 查詢一行元素

frame_index_value4 = dataframe2.iloc[0] # 查詢一行元素(絕對位置)

frame_index_value5 = dataframe2.values[0] # 查詢一行元素

frame_column_value1 = dataframe2["price"] # 查詢一列元素

frame_column_value2 = dataframe2.loc[:, "price"] # 查詢一列元素

frame_column_value3 = dataframe2.iloc[:, 0] # 查詢一列元素(絕對位置)

4、查詢dataframe中的多行/列元素

data = 

dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])

# 查詢dataframe多行/列元素

dataframe2.head(5) # 檢視前5行元素

dataframe2.tail(5) # 檢視後5行元素

frame_index_values1 = dataframe2["index1":"index4"] # 切片多行

frame_index_values2 = dataframe2[0:4] # 切片多行

frame_index_values3 = dataframe2.ix[["index1", "index2"]] # 多行

frame_index_values4 = dataframe2.ix[[0, 1]] # 多行

frame_index_values5 = dataframe2.loc[["index1", "index2"]] # 多行

frame_index_values6 = dataframe2.iloc[[0, 1]] # 多行

frame_column_values1 = dataframe2.loc[:, ["price"]] # 多列

frame_column_values2 = dataframe2.iloc[:, [0, 1]] # 多列

frame_column_values3 = dataframe2.ix[:, ["price", "color"]] # 多列

frame_column_values4 = dataframe2.ix[:, [0, 1]] # 多列

5、查詢dataframe多行多列元素

# 查詢dataframe多行多列元素

frame_values1 = dataframe2.loc[["index1", "index3"], ["price"]] # 索引查詢

frame_values2 = dataframe2.iloc[[1, 2], [0]] # 絕對位置查詢

frame_values3 = dataframe2.ix[["index1", "index3"], ["price"]]

frame_values4 = dataframe2.ix[[1, 2], [0]]

6、新增一行/列元素

print("####新增一行元素####")

dataframe2.loc["index6"] = ["pink", 3] # dataframe2.loc["index6"]=10

dataframe2.iloc[5] = 10

dataframe2.ix["index7"] = 10

print("####新增一列元素####")

dataframe2.loc[:, "size"] = "small"

dataframe2.iloc[:, 2] = 10

7、修改元素

# 修改元素

dataframe2.loc["index1", "price"] = 100

dataframe2.iloc[0, 1] = 10

dataframe2.at["index1", "price"] = 100

dataframe2.iat[0, 1] = 10

print(dataframe2)

8、刪除元素

dataframe2.drop(["index6", "index7"], inplace=true)  # inplace=true表示作用在原陣列

dataframe2.drop(["size"], axis=1, inplace=false)

Python資料處理庫pandas入門教程

pandas是乙個python的yuyi語言軟體包,在我們使用python語音進行機器學習程式設計的時候,這是乙個非常常用的基礎程式設計庫。本文是對它的乙個入門教程。pandas提供了快速,靈活和富有表現力的資料結構,目的是使 關係 或 標記 資料的工作既簡單又直觀。它旨在成為在python中進行實...

pandas 高階使用

目錄 csv comma separated values 格式的檔案是指以純文字形式儲存的 資料,這意味著不能簡單的使用excel 工具進行處理,而且excel 處理的資料量十分有限,而使用pandas來處理資料量巨大的csv檔案就容易的多了。import pandas as pd deftest...

pandas高階 DataFrame高階操作

我想這篇部落格內容可能比較散,因為我沒有任何思路,可能想到 寫到 工作中用到什麼功能寫什麼功能。1.drop duplicates drop duplicates 的作用是刪除重複行,首先,有這麼乙個dataframe df.drop duplicates 後的結果 drop duplicates ...