pandas資料結構(dataframe)
dataframe是乙個**型的資料結構,它含有一組有序的列,每列可以是不同的值型別(數值、字串、布林值),dataframe既有行索引也有列索引,可被看作是有series組成的字典。
1、建立dataframe
import pandas as pd
import numpy as np
# 建立dataframe
data =
dataframe1 = pd.dataframe(data=data) # 通過字典建立
dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])
dataframe3 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"], columns=["price"]) # 指定列索引
dataframe4 = pd.dataframe(data=np.arange(12).reshape(3, 4)) # 通過numpy陣列建立
2、查詢dataframe中的元素
data =
dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])
frame_index = dataframe2.index # 查詢dataframe中的所有行標籤
frame_column = dataframe2.columns # 查詢dataframe中所有列標籤
frame_values = dataframe2.values # 查詢dataframe中的所有值
frame_value1 = dataframe2["color"]["index1"] # 索引查詢數值(先列後行)
frame_value2 = dataframe2.at["index1", "color"] # 索引查詢數值
frame_value3 = dataframe2.iat[0, 0] # 絕對位置查詢數值
3、查詢dataframe中某一行/列元素
data =
dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])
# 查詢dataframe一行/列元素
frame_index_value1 = dataframe2.ix["index1"] # 查詢一行元素
frame_index_value2 = dataframe2.ix[0] # 查詢一行元素(絕對位置)
frame_index_value3 = dataframe2.loc["index1"] # 查詢一行元素
frame_index_value4 = dataframe2.iloc[0] # 查詢一行元素(絕對位置)
frame_index_value5 = dataframe2.values[0] # 查詢一行元素
frame_column_value1 = dataframe2["price"] # 查詢一列元素
frame_column_value2 = dataframe2.loc[:, "price"] # 查詢一列元素
frame_column_value3 = dataframe2.iloc[:, 0] # 查詢一列元素(絕對位置)
4、查詢dataframe中的多行/列元素
data =
dataframe2 = pd.dataframe(data=data, index=["index1", "index2", "index3", "index4", "index5"])
# 查詢dataframe多行/列元素
dataframe2.head(5) # 檢視前5行元素
dataframe2.tail(5) # 檢視後5行元素
frame_index_values1 = dataframe2["index1":"index4"] # 切片多行
frame_index_values2 = dataframe2[0:4] # 切片多行
frame_index_values3 = dataframe2.ix[["index1", "index2"]] # 多行
frame_index_values4 = dataframe2.ix[[0, 1]] # 多行
frame_index_values5 = dataframe2.loc[["index1", "index2"]] # 多行
frame_index_values6 = dataframe2.iloc[[0, 1]] # 多行
frame_column_values1 = dataframe2.loc[:, ["price"]] # 多列
frame_column_values2 = dataframe2.iloc[:, [0, 1]] # 多列
frame_column_values3 = dataframe2.ix[:, ["price", "color"]] # 多列
frame_column_values4 = dataframe2.ix[:, [0, 1]] # 多列
5、查詢dataframe多行多列元素
# 查詢dataframe多行多列元素
frame_values1 = dataframe2.loc[["index1", "index3"], ["price"]] # 索引查詢
frame_values2 = dataframe2.iloc[[1, 2], [0]] # 絕對位置查詢
frame_values3 = dataframe2.ix[["index1", "index3"], ["price"]]
frame_values4 = dataframe2.ix[[1, 2], [0]]
6、新增一行/列元素
print("####新增一行元素####")
dataframe2.loc["index6"] = ["pink", 3] # dataframe2.loc["index6"]=10
dataframe2.iloc[5] = 10
dataframe2.ix["index7"] = 10
print("####新增一列元素####")
dataframe2.loc[:, "size"] = "small"
dataframe2.iloc[:, 2] = 10
7、修改元素
# 修改元素
dataframe2.loc["index1", "price"] = 100
dataframe2.iloc[0, 1] = 10
dataframe2.at["index1", "price"] = 100
dataframe2.iat[0, 1] = 10
print(dataframe2)
8、刪除元素
dataframe2.drop(["index6", "index7"], inplace=true) # inplace=true表示作用在原陣列
dataframe2.drop(["size"], axis=1, inplace=false)
Python資料處理庫pandas入門教程
pandas是乙個python的yuyi語言軟體包,在我們使用python語音進行機器學習程式設計的時候,這是乙個非常常用的基礎程式設計庫。本文是對它的乙個入門教程。pandas提供了快速,靈活和富有表現力的資料結構,目的是使 關係 或 標記 資料的工作既簡單又直觀。它旨在成為在python中進行實...
pandas 高階使用
目錄 csv comma separated values 格式的檔案是指以純文字形式儲存的 資料,這意味著不能簡單的使用excel 工具進行處理,而且excel 處理的資料量十分有限,而使用pandas來處理資料量巨大的csv檔案就容易的多了。import pandas as pd deftest...
pandas高階 DataFrame高階操作
我想這篇部落格內容可能比較散,因為我沒有任何思路,可能想到 寫到 工作中用到什麼功能寫什麼功能。1.drop duplicates drop duplicates 的作用是刪除重複行,首先,有這麼乙個dataframe df.drop duplicates 後的結果 drop duplicates ...