Pandas及簡單學習

2021-09-11 21:46:10 字數 2310 閱讀 9281

pandas

pandas 是一種列存資料分析 api。它是用於處理和分析輸入資料的強大工具,很多機器學習框架都支援將 pandas 資料結構作為輸入。

匯入 pandas api 並輸出相應的 api 版本

from __future__ import print_function

import pandas as pd

pd.__version__

pandas主要資料結構分類:

建立series

pd.series(['iterm_1','iterm_2','iterm_3',...])   #新增自定義個數item
建立dataframe物件

dataframe即是由多個series構成

如果插入的series 在長度上不一致,系統會用特殊的 na/nan 值填充缺失的值。

載入整個檔案到dataframe

其中使用了 dataframe.describe() 來顯示關於 dataframe 的統計資訊。另乙個實用函式是 dataframe.head(),它顯示 dataframe 的前幾個記錄。

繪製直方圖

借助 dataframe.hist()繪製某一series的直方圖

訪問資料

利用python的list/dict操作即可訪問dataframe中的資料。

例如:

cities = pd.dataframe()

print(type(cities['city name']))

cities['city name']

print(type(cities['city name'][1]))

cities['city name'][1]

print(type(cities[0:2]))

cities[0:2]

without output pictures,hahahah

操控資料

population / 1000.
可以匯入numpy對資料進行處理:

import numpy as np

np.log(population)

without output pictures too (dancing

dataframe修改

向現有 dataframe 新增了兩個 series:

pandas簡單應用

機器學習離不開資料,資料分析離不開pandas。昨天感受了一下,真的方便。按照一般的使用過程,將pandas的常用方法說明一下。首先,我們拿到乙個excel表,我們將之另存為csv檔案。因為檔案是實驗室的資源,我就不分享了。首先是檔案讀取 def load csv filename data pd....

pandas按條件過濾 Pandas簡單入門

本文作為pandas入門及筆記用途!1.匯入pandas及資料表 import pandas as pd df pd.read csv uk rain 2014.csv header 0 2.更改列標籤及檢視前5行資料 3.查詢資料表行數及維度 df.shape 33,7 len df 4.檢視資料...

pandas簡單處理資料

pandas處理資料 1 建立資料 建立series,讓pandas建立乙個索引 2檢視資料 檢視框架的頂行和底行 head tail 顯示索引 列 基礎numpy資料 index columns valuesdescribe 顯示快速統計摘要 3 缺少資料 刪除缺少資料的行 line.dropna...