python資料分析pandas(一)

2021-09-13 14:13:29 字數 1500 閱讀 4945

pandas是乙個開源python資料分析庫。python在資料處理和準備方面比較好,而pandas其彌補了python在資料分析和建模方面的空白。但是pandas沒有在先行和面板回歸之外實現重要的建模功能。

網域名稱訪問:

matplotliib中文文件:

numpy中文文件:

#conda install pandas

或者#python3 -m pip install --upgrade pandas

>>> import numpy as np

>>> import pandas as pd

>>> s = pd.series([1,113,5,np.nan,6,8])

>>> s

0 1.0

1 113.0

2 5.0

3 nan

4 6.0

5 8.0

>>> dates = pd.date_range('20130101', periods=6)

>>> dates

datetimeindex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',

'2013-01-05', '2013-01-06'],

dtype='datetime64[ns]', freq='d')

>>> df = pd.dataframe(np.random.randn(6,4),index=dates,columns=list('abcd'))

>>> df

a b c d

2013-01-01 -0.577478 1.070305 1.064543 1.000650

2013-01-02 -0.946411 2.060132 -0.475975 -0.229762

2013-01-03 -2.131564 -0.295221 1.158219 -0.316330

2013-01-04 0.709907 0.888202 -0.027737 -0.012751

2013-01-05 0.265113 1.988058 0.755450 0.346450

2013-01-06 0.897981 0.110506 0.387603 -2.287876

>>> df2 = pd.dataframe({'a':1.,'b':pd.timestamp('20130102'),'c':pd.series(1,index=list(range(4)),dtype='f

>>> df2

a b c

0 1.0 2013-01-02 1.0

1 1.0 2013-01-02 1.0

2 1.0 2013-01-02 1.0

3 1.0 2013-01-02 1.0

panda資料分析

1.將離散變數進行one hot編碼 在作為示例的租房資料中,分類變數 neighborhood 可以對應三個值 運用 scikit learn 中的 dictvectorizer 函式,我們將以上租房資料的分類變數轉換為 one hot 形式 可以通過呼叫 getfeaturenames 函式,來...

python資料分析筆記中panda 3

1 按照空格將一列的內容分為兩列 1 from pandas import series 2from pandas import dataframe 3from pandas import read csv 45 欄位的拆分 按照固定的字元 拆分已有的字串 6 函式 splite sep,n.exp...

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...