機器學習 pandas庫使用

2021-09-25 19:58:11 字數 2072 閱讀 2158

關於pandas庫中dataframe的使用,dataframe表示的是乙個有序的**,dataframe有自己的行索引和列索引,這與series不同,series只有列索引,dataframe每一列,每一行都可以是不同的資料型別,接下來讓我們來看一下dataframe的使用

import pandas as pd

data = pd.dataframe([[

1,2,

3],[

4,5.9,6]

,[1,

2,3]

,['%7',8

,9]]

, columns=

["feature_1"

,"feature_2"

,"label"])

print

(data)

效果如下:

這裡我們可以看出原資料只有5.9是浮點數,但dataframe自動的將這個數所在的一列都變成了浮點數,也就可以認為第一列是字串型別這裡我們要檢視型別只需要用dtypes方法來檢視,

結果清晰的看出第一列是字串型別,這裡的object我們可以理解為python中的str型別,而第二列也變成了浮點型

刪除

del data[

檢視字段資訊

檢視統計資訊

注意:因為feature_1是字串型別所以不能對其進行統計

修改列表名

這是修改列表名的兩種寫法,加上inplace = true就不需要返回值來接收,不加則需要檢視的是返回值的資訊

替換字串

資料去重

按條件修改元素

機器學習之pandas

import pandas as pd a pd.read csv 檔案路徑 讀取檔案 a.head 顯示的條數 顯示前部分資料 a.tail 顯示的條數 顯示後部分資料 a.columns 輸出列 a.loc 序列號 輸出乙個樣本 a.columns.tolist 將列轉換成列表 c.endwit...

Python 機器學習 Pandas

import pandas pandas 資料預處理非常很好使用 檢視資料 pandas詳細說明 讀取.csv檔案 輸入絕對路徑,同檔案可以相對路徑 print type food info 資料型別 dataframe 有許多行列組成 每一行或列交series print food info.dt...

機器學習 Pandas基礎學習

pandas是為了解決資料分析任務而建立的,納入了大量的庫和標準資料模型,提供了高效地操作大型資料集所需的工具。對於pandas包,在python中常見的匯入方法如下 from pandas import series,dataframe import pandas as pd pandas中的資料...