資料分析 pandas操作使用

2021-09-26 08:02:12 字數 1217 閱讀 9294

一、使用指引

1.資料型別series

1.1構建

a.python列表直接構建		

b.通過numpy的 ndarray構建

c.通過字典構建

1.2索引

a.取單個資料	

b.取連續的多個資料

c.取不連續多個資料

d.根據條件取值(布林索引)

2.資料型別dataframe

2.1構建

a.巢狀的列表 / 二維ndarray 構建

b.通過字典構建

2.2索引

2.2.1【基本索引】

a.取某列

b.取某個資料

c.取不連續的多列

d.取連續的多行

e.按條件索引

2.2.2【高階索引】

a.根據索引名取值:loc

取單行,

取單列,

取單行單列,

取連續多行,

取連續多列,

取連續的多行多列,

取不連續的多行,

取不連續的多列,

取不連續的多行多列,

布林取值

b.根據下標取值:iloc

c.混合索引:ix

3.資料操作

a.新增索引資料

b.刪除索引資料

c.索引重新命名

d.索引物件型別轉換

4.對齊運算

5.處理缺失值

a.判斷資料集是否有缺失值

b.刪除缺失值所在的行 / 列

c.填充缺失值

6.處理重複資料

a.判斷某列中是否有重複資料

b.直接刪除重複資料的行

c.替換指定資料

c.1 單值替換

c.2 多值替換

c.3 不同值做不同替換

c.4 dataframe物件指定列替換指定值

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

Python資料分析 pandas 基本操作

構建資料集 import pandas as pd import numpy as np n 20 dataset pd.dataframe 顯示前五行 獲取所有元素的值 返回numpy陣列 dataset.values 獲取資料型別 dataset.dtypes 獲取行名 dataset.inde...

資料分析學習 使用Pandas進行資料分析

在對資料進行分析時,首先需要了解相關的名詞在該行業裡的含義,即查閱相關知識對題目進行整體把握。下面是進行資料分析的步驟 1 讀取資料 import pandas as pd data pd.read csv data train.csv 2 對資料進行預處理 具體包括 1 剔除空白值超過一半的列 h...