Python資料分析基礎模組了解

2021-08-19 07:00:43 字數 1616 閱讀 1820

python資料分析基礎模組

numpy  scipy  pandas  matplotlib

數值計算 numpy ;資料處理分析 pandas ;視覺化 matplotlib/seaborn

機器學習 sklearn/keras  ;互動 pygame ;網路 selenium etc

conda install ***  或者 pip/pip3 install ***

numpy提供常用的數值陣列,矩陣等函式

numpy特點:

1 基於向量化的運算

2 進行數值運算時numpy陣列比list效率高

# -*- coding: utf-8 -*-

import numpy as np

__author__ = 'zxl'

__product__ = 'pycharm'

__filename__ = 'numpy1'

print(np.arange(10))

for i in range(10):

print(i)

a = np.arange(10)

print(a**2)

scipy 是一種基於numpy的擴充套件 用來做高等數學,訊號處理,優化,統計的擴充套件包

比如線性代數,統計的 空間的資料結構

# -*- coding: utf-8 -*-

import numpy as np

from scipy import linalg

__author__ = 'dongfangyao'

__date__ = '2017/12/17 下午2:35'

__product__ = 'pycharm'

__filename__ = 'scipy1'

a = np.array([[1, 2], [30, 4]])

print(a)

# 二階方陣行列式

print(linalg.det(a))

# 推薦用scipy.linalg代替numpy.linalg

pandas 是一種構建於numpy的高階資料結構和精巧工具,快速簡單的處理資料,資料結構

series 和dataframe

# -*- coding: utf-8 -*-

import numpy as np

import pandas as pd

__author__ = 'dongfangyao'

__date__ = '2017/12/17 下午3:13'

__product__ = 'pycharm'

__filename__ = 'pandas1'

s = pd.series([2, 4, 5, np.nan, 8, 9])

print(s)

dates = pd.date_range('20171201', periods=7)

print(dates)

df = pd.dataframe(np.random.randn(7, 4), index=dates, columns=list('abcd'))

print(df)

# 轉置

# print(df.t)

print(df.sort_values(by='b'))

python基礎分析 資料分析 Python基礎

學python前要明確其使用目的。學python是為了進行資料分析,所以現階段最主要的任務是了解python的最基礎知識,然後通過運用python進行資料分析的專案,從而學會使用python。一 資料型別 1 整數 浮點數 字串 2 列表 list 2list.count obj 統計某個元素在列表...

Python 資料分析 Numpy模組

numpy模組可以高效的處理資料,提供陣列支援 很多模組都依賴他,比如 pandas scipy matplotlib 首先到 下查詢numpy mkl 我的python版本是3.6.1,系統是64位 使用如下命令安裝 pip install numpy 1.13.3 mkl cp36 cp36m ...

Python 資料分析 Numpy模組

numpy模組可以高效的處理資料,提供陣列支援 很多模組都依賴他,比如 pandas scipy matplotlib 首先到 下查詢numpy mkl 我的python版本是3.6.1,系統是64位 使用如下命令安裝 pip install numpy 1.13.3 mkl cp36 cp36m ...