利用Python進行資料分析環境部署

2021-07-15 07:37:58 字數 748 閱讀 3804

系統環境:win7 64位+i54460+8g,micosoft visual studio 2010(不要裝更高的版本,不然matlab r2011a用不了了,呵呵)

1.安裝python27:python-2.7.12.amd64,目錄d:\python27(所有都勾上,尤其是pip,安裝外掛程式包要用)

2.安裝epd free(整合了numpy,scipy,matplotlib,ipython,書上說pandas也有,不過實際上似乎沒有,需要另外安裝),只找到了32位的,不過似乎用起來也沒問題。

3.安裝pandas,把shell目錄設定到d:\python27\scripts,直接pip install pandas(有時候會報錯,直接把pandas-0.18.1-cp27-cp27m-win32.whl扔到d:\python27\scripts下面,執行pip install pandas-0.18.1-cp27-cp27m-win32.whl也可以,注意版本要和epd一致,用32位版的)

4.安裝statsmodels(計量經濟包),安裝的時候會報錯(unable to find vcvarsall.bat),進入「d:\python27\lib\distutils」,用編輯器開啟「msvc9compiler.py」,拉到243行,把vs%o.focomntools替換為vs100comntools(vs100就是visual studio 2010的意思),儲存退出,再pip install statsmodels就好了

5.然後再安裝其他外掛程式,xlrd,xlwt,lxml等等

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...

《利用Python進行資料分析》筆記

之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...