Pandas 基本介紹和基礎操作

2021-10-25 14:47:26 字數 1480 閱讀 1606

目錄

一、numpy和pandas的不同

二、pandas序列操作

# 二、pandas序列

import pandas as pd

import numpy as np

# 1.生成乙個簡單的一維陣列

# 下面的語句可以理解為新建了乙個一維陣列,但是每行都有乙個標號

s = pd.series([1,3,6,np.nan,44,1])

print(s)

# 2.生成乙個具有行標號和縱標號的二維矩陣

# 生成乙個用於行的索引序列

dates = pd.date_range('20210125', periods=6)

print(dates)

# dataframe是乙個matrix,可以理解為二維的numpy

# ① np.random.randn(6,4)是data,使用numpy隨機數生成

# ② index = dates,定義行索引

# ③ columns = ,定義列索引

df = pd.dataframe(np.random.randn(6,4), index=dates, columns=['a','b','c','d'])

print(df)

# 預設二維矩陣的標號是什麼樣的:使用0,1,2,3,..去表示

df1 = pd.dataframe(np.arange(12).reshape((3,4)))

print(df1)

# 3.使用字典建立dataframe, 每個字典代表一列,key值表示列名

df2 = pd.dataframe()

print(df2)

# 4.輸出行標號

print(df2.index)

# 5.輸出列標號

print(df2.columns)

# 6.輸出每列的標號及其型別

print(df2.dtypes)

# 7.輸出全部的值

print(df2.values, type(df2.values))

# 8.describe描述,只對數值型別的元素起作用,輸出資料的count、mean、std、min、25%、50%、75%、max

print(df2.describe())

# 9.轉置

print(df2.t)

# 10.標號名排序,sort_index,根據標號的名字去排序,axis = 1表示列,axis = 0表示行,ascending表示是否公升序

print(df2.sort_index(axis = 1, ascending=false))

print(df2.sort_index(axis = 0, ascending=false))

# 11.根據列值排序,sort_values,根據值排序,by列標號名

print(df2.sort_values(by='e'))

Pandas 基本介紹

本文是pandas的基本介紹 若用 python 的列表和字典來作比較,那麼可以說 numpy 是列表形式,而 pandas 就是字典形式。pandas是基於numpy構建的,讓numpy為中心的應用變得更加簡單。要使用pandas,首先要了解他主要兩個資料結構 series和dataframe。s...

Pandas基本操作

常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複,保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...

pandas基本操作

pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...