python 資料科學平台 anaconda

2021-08-15 15:25:17 字數 1058 閱讀 5900

anaconda是使用python進行資料分析、機器學習的最容易方式,裡面包含大量的資料科學包,參見 :是python的分發版本庫,包含python開發環境以及1000多個python庫和軟體包,比如包含一些重要的科學計算工具包等。

1、ide環境

anaconda包含python 的ide環境,比如 ipython, jupter qtconsole, jupter notebook, spyder等

2、資料統計分析工具包,有numpy, scipy, numba,pandas,dask, pytbales等

3、機器學習工具,比如: tensorflow, h2o.ai 等

4、 anaconda包含乙個conda包,使用conda可以安裝不同版本的python以及其他工具包。

使用conda按轉不同版本的python環境

安裝python2.7,   命令如下: conda  create  -n  python2.7  python=2.7

安裝python3.5,   命令如下: conda  create  -n  python3.5  python=3.5

切換到python3.5,命令如下: activate  python3.5

取消python3.5,命令如下: deactivate python3.5

檢視本地已經安裝的python環境,使用命令:conda  info  --envs 

查詢包: conda list  , conda search 

更新包: conda update 

刪除包:conda  remove

5、使用conda安裝python工具包的最大好處是能夠確保所安裝的工具包與python的環境版本一致,如果使用pip安裝工具包,可能會與python環境不一致,導致所安裝的工具包不能正常使用。

是目前比較流行的python ide環境,方便與其他人分享原始碼及協作程式設計。

安裝完anaconda之後會自動安裝jupyter notebook.

jupyter notebook 參見**:www.jupyter.org

啟動命令:jupyter notebook

IBM 資料科學平台三大特性解決資料科學家協作問題

雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...

IBM 資料科學平台三大特性解決資料科學家協作問題

雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...

python資料科學 Pandas

學習筆記 pandas物件 資料的取值與選擇 pandas數值運算方法 缺失值的處理 層級索引 合併與連線資料集 累積與分組 pandas物件 pandas有三個基本資料結構 series dataframe和index 資料的取值與選擇 pandas數值運算方法 pandas是建立在numpy基礎...