Pandas基本操作

2021-09-12 07:50:16 字數 1698 閱讀 9245

常用技巧

(1)讀取檔案

(2)初步設定

#最大顯示1000行

#最大顯示20列

#最大精度

(3)去重

#所有列相同為重複

#k1相同為重複,保留最後乙個(預設保留第乙個)

(4)顯示當前路徑

(5)jupyter下畫圖

(6)計算運算時間

(7)建立新變數

(8)刪除乙個變數

(9)刪除一行觀測

(10)顯示前三行

(11)顯示多列

(12)所有字串轉為小寫

(13)所有字串轉為大寫

(14)取某列前兩個數

(15)切片

#單個邏輯條件

#多個邏輯條件組合

(15)切片

#單個邏輯條件

#多個邏輯條件組合

#query

(16)橫向連線資料集

-pd.merge(frame1,frame2,left_index=true, right_index=true)

(17)縱向連線資料集

刪除重複觀測(完全重複)

print (pd.concat([frame1,frame2]))

刪除重複觀測(完全重複)

pd.concat([frame1,frame2],ignore_index=true).drop_duplicates()

(18)連續變數離散化

(19)連續變數離散化2

#有索引的切分

(20)處理缺失值

(22)連線mysql

(23)分類彙總

(24)雙索引取第二個索引

(25)資料拼接

(25)表連線

pandas

一、 series

(1)建立series

(2)顯示索引

(3)顯示值

(4)基本描述

(5)取資料集行列

(6)顯示前兩行(預設5)

(7)顯示後兩行(預設5)

(8)排序

二、 dataframe

(1)建立dataframe

(2)計算新列

(3)顯示索引

(4)顯示值

(5)顯示列名

(6)基本描述

(7)顯示頻數

(8)顯示前兩行(預設5)

(9)顯示後兩行(預設5)

(10)顯示資料型別

(11)修改資料型別

(12)設定索引名

(13)轉換為其他型別

#轉換為字典

#轉換為csv

(14)將變數設定為索引並恢復

(15)修改列名

(16)排序

#index降序排列

#按diff公升序排列

-df.sort(columns=[『bonus_percent』,『diff』],ascending=[0,1])

(17)去重

#所有列相同為重複

#k1相同為重複,保留最後乙個(預設保留第乙個)

(18)查詢並替換

gone!:

(19)利用字典做對映,建立新列

#map

#呼叫函式(需先調整大小寫)

四、 索引

#取變數

#取前三行

五、切片

#單個邏輯條件

#多個邏輯條件組合

pandas基本操作

pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...

pandas基本操作 1

這裡來介紹一下pandas。由於知識點比較多,決定分幾篇介紹。import numpy as np import pandas as pd pandas是基於numpy的乙個開源python庫。我認為相當於python版excel series是一種一維陣列,是基於ndarray設計的,但是他多了乙...

pandas的基本操作

資料讀寫 讀入mysql資料庫資料 匯入第三方模組 import pymysql 連線mysql資料庫 conn pymysql.connect host localhost user root password test database test port 3306 charset utf8 讀...