Python資料分析Pandas庫資料結構 一

2022-06-26 23:06:16 字數 1052 閱讀 3773

import pandas as pd

import numpy as np

s = pd.series([1,2,3,4,np.nan,9,9])

s2 = pd.date_range('20181201',periods=6)#periods週期

import pandas as pd

import numpy as np

#(1)建立二維矩陣

df = pd.dataframe([[1,2,3],[4,5,6],[7,8,9]],columns=list('abc'),index=data_index)

#(2)建立二維矩陣自動生成

df1 = pd.dataframe(np.arange(1,10).reshape(3,3),columns=list('abc'),index=data_index)

df1#(3)字典的方式

data_index = pd.date_range('20181016',periods=3)

df2 = pd.dataframe(,index=data_index)

df2​

1.索引預設從0開始

2.索引被替換為字串或時間

import pandas as pd

import numpy as np

#重置索引

df2.iloc[1,2] = np.nan

df2​

#判斷df2.isna()

​#填充資料

df3 = df2.fillna(value='bb')#替換,把空值得資料替換成bb,不操控原陣列,

df3​

#刪除有空值的資料,整行都刪除

df2.dropna()

​#當陣列索引資料都為空的時候才刪除資料

df2.dropna(how='all')

df2​

​#刪除有空值的資料,整行都刪除,原陣列不變

xx = df2.dropna(how='any')

xx

未完待續~~~~~

panda資料分析

1.將離散變數進行one hot編碼 在作為示例的租房資料中,分類變數 neighborhood 可以對應三個值 運用 scikit learn 中的 dictvectorizer 函式,我們將以上租房資料的分類變數轉換為 one hot 形式 可以通過呼叫 getfeaturenames 函式,來...

python資料分析筆記中panda 3

1 按照空格將一列的內容分為兩列 1 from pandas import series 2from pandas import dataframe 3from pandas import read csv 45 欄位的拆分 按照固定的字元 拆分已有的字串 6 函式 splite sep,n.exp...

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...