pandas資料合併

2021-08-04 05:48:59 字數 1178 閱讀 7563

pandas 提供了三種主要方法可以對資料進行合併:

pandas.merge()方法:資料庫風格的合併

例如,通過merge()方法將兩個dataframe合併:

on='name'的意思是將name列當作鍵;

預設情況下,merge做的是內連線(inner),即鍵的交集。

其他方式還有左連線(left),右連線(right)和外連線(outer)。例如將剛剛的合併指定為左連線:

再試試外連線,結果取鍵的並集:

剛剛的三個合併都是以列名作為連線鍵,dataframe還有乙個join()方法可以以索引作為連線鍵

例如:

pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起

例如:

預設情況下,concat在豎軸(axis=0)上連線,即產生乙個新的series。如果想要在橫軸方向連線,則傳入axis=1,例如:

例項方法combine_first()方法:合併重疊資料

例如:

這個方法等價與:

它做的是乙個向量化的if-else操作,如果s1裡某個位置上的資料為空,則用s2同位置上的元素來補,你可以理解為「打補丁」操作。

pandas合併資料merge

snailtyan 本文主要是關於pandas的一些基本用法。usr bin env python coding utf 8 import pandas as pd import numpy as np test 1 定義資料 left pd.dataframe right pd.dataframe...

pandas (七)資料合併

合併拼接行 將df2中的行新增到df1的尾部 指定列合併成乙個新錶新列 ndf df 提名1 提名2 ignore index true 提名3 ignore index true ndf pd.dataframe ndf,columns 姓名 將df2中的列新增到df1的尾部 df.concat ...

pandas之資料合併

import numpy as np import pandas as pd df1 pd.dataframe np.ones 3,4 0,columns a b c d df2 pd.dataframe np.ones 3,4 1,columns a b c d df3 pd.dataframe ...