pandas 常見 使用方法 以及使用場景

2021-10-09 04:04:00 字數 2023 閱讀 3468

ndarray 資料型別

numpy 索引:

陣列轉置和軸對換

通用函式:一種對ndarray中的資料執行元素級運算的函式(分為一元ufunc、二元ufunc)

2.去重 undifieddata=data.drop_duplicates(subset=[「shipid」],keep=「first」)

3.合併 mergedata=pd.merge(df1,df2,left_on=「mmsi」,right_on=「shipid」,how=「left」)

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-i5hk5gzl-1597309736709)(img/pic4.png)]

5.dataframe to list dataframe 轉化為list 物件

6.list to dataframe list(list裡面巢狀多個list) 轉化為dataframe 物件

7.dataframe 合併 pd.concat([df,polygendataframe],axis=0,ignore_index=true)

8.新增dataframe某列元素

9.dataframe 取出包含指定條件的多行

10.dataframe 取某行資料

11.乙個dataframe追加另乙個dataframe資料 empty = pandas.dataframe()​

12.遍歷dataframe pandas

13.dataframe

儲存為csv檔案

14.pandas pandas.cut 離散化。把連續資料離散化(分箱操作) 。根據指定分界點對連續資料進行分箱處理 pandas.cut(x, bins, right=true, labels=none, retbins=false, precision=3, include_lowest=false, duplicates=『raise』)

15.建立乙個空的 dataframe data=pd.dataframe()

16.nan判斷 pd.isna(row[「shipclass」]) 判斷row[「shipclass」]是否為nan 在dataframe 中,nan為float型別,只能使用這種自帶的方式判斷是否為nan

17.dataframe 資料集 取某幾列資料

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-tqz8ifdo-1597309736712)(img/pic6.png)]

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-v0f5uohf-1597309736713)(img/pic7.png)]

df[(1 - pd.isnull(df[「port_name」])).astype(np.bool)] 取port_name 為非nan行

mmsirow=[name for i in range(0,len(ordered))]

使用 astype() 進行型別轉化

使用astype() 把 『teu』 這一列轉換為float型別

df[『teu』] = df[『teu』].astype(「float」)

某列資料轉化為int,並除以1e6

df[『c6』] = df[『c6』].values.astype(「int」)/1e6

自定義函式清洗方法1

def convert_currency(var):

"""convert the string number to a float

_ 去除$

- 去除逗號,

- 轉化為浮點數型別

"""

new_value = var.replace(",","").replace("$","")

return float(new_value)

利用np.where() function 將active 列轉化為布林值

df[「active」] = np.where(df[「active」] == 「y」, true, false)

Pandas使用方法

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 安裝方法 pip install pandas 引用方法 import pandas as pd series...

pandas的to csv 使用方法

1.首先查詢當前的工作路徑 import os os.getcwd 獲取當前工作路徑2.to csv 是dataframe類的方法,read csv 是pandas的方法 dt.to csv 預設dt是dataframe的乙個例項,引數解釋如下 dt.to csv result.csv 相對位置,儲...

Linux的常見基礎指令以及使用方法

這是我的第一篇文章,本文主要介紹的是在學習linux的過程中會遇到的常見的11個基礎指令。我寫這篇文章的目的一方面是自己正在學習這一方面的知識,另一方面是想和大家分享一下自己的學習成果。1.ls指令 含義 list列表,清單。作用 列出當前目錄下所有檔案和資料夾的名稱。用法 ls 路徑 列出該路徑下...