python資料分析學習路線

2021-08-02 22:48:50 字數 1779 閱讀 3917

python是一種物件導向、直譯式計算機程式語言,由guido van rossum於2023年底發明。由於他簡單、易學、免費開源、可移植性、可擴充套件性等特點,python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,python受歡迎程度扶搖直上。

**用python玩轉資料

由於python擁有非常豐富的庫,使其在資料分析領域也有廣泛的應用。由於python本身有十分廣泛的應用,本期python資料分析路線圖主要從資料分析從業人員的角度講述python資料分析路線圖。整個路線圖計畫分成16周,120天左右。主要學習內容包括四大部分:

1)python工作環境及基礎語法知識了解(包括正規表示式相關知識學習);

2)資料採集相關知識(python爬蟲相關知識);

3)資料分析學習;

4)資料視覺化學習。

python學習路徑計畫圖

python工作環境及基礎語法知識了解

對於python基礎語法學習部分,學習週期大概為4周,需要的相關資源在網路上都能找到免費的資源,而且質量都不錯。相關中文資源如下:

1.python工作整合環境包

2.python資料分析相關庫(pandas/ numpy/

scipy/ matplotlib)

如果安裝了上面整合工作包,則下面的包不需要重新安裝了。關於包的安裝方法在學習資源圖書中都有介紹,通常安裝庫採用pip方法,也可以用pip list查詢系統安裝了哪些庫。

3.學習資源

2) 正則式學習

2) 慕課網python高階

資料採集學習

對於資料採集部分的學習主要是通過python爬蟲的學習了解基本的外部資料採集情況,當然也可以借助別人寫好的規則庫直接完成某些資料的採集。這部分內容的學習週期大概也為四周,需要的相關資源在網路上都能找到免費的資源,而且質量都不錯。相關中文資源如下:

1. python爬蟲入門一之綜述

2. python爬蟲入門二之爬蟲基礎了解

3. python爬蟲入門三之urllib庫的基本使用

4. python爬蟲入門四之urllib庫的高階用法

5. python爬蟲入門五之urlerror異常處理

6. python爬蟲入門六之cookie的使用

7. python爬蟲入門七之正規表示式

8. python爬蟲實戰一之爬取糗事百科段子

10. python爬蟲實戰三之計算大學本學期績點

11. python爬蟲實戰四之抓取**mm**

12. python爬蟲高階一之爬蟲框架scrapy安裝配置

資料分析

python資料分析的學習主要是對相關庫的使用,比如資料整理需要用到numpy和pandas庫,資料描述與分析分析則主要用到pandas庫,從某種程度上講,利用python進行資料分析的學習過程就是對庫的學習過程。由於有了前面2部分內容的學習基礎,本部分內容的建議學習練習時間也為4周,相關免費學習資源如下:

資料視覺化

python資料視覺化學習的過程就是學習matplotlib庫的過程,matplotlib庫包含有豐富的資料視覺化資源,地圖、3d等等都有涉及,如果有前面3部分的學習經驗的話,這部分內容在4週內也能解決。相關中文學習資源如下:

1. 利用python繪圖和視覺化(1)

2. 利用python繪圖和視覺化(2)

Python 資料分析學習路線

資料類有多火就不多說了,資料和資料分析在生活中的實用性和重要性都是不言而喻。正是由於此類的原因,利用業餘時間自學了一段時間的資料分析。資料分析是指用適當利用統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。概括成一句話就是分析資料,得到結果。所以需要...

Python 資料分析學習路線

相關資料 資料分析 資料分析是指用適當利用統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。分析資料,得到結果 基礎部分 數學知識 python基礎知識 python資料分析包使用 高階部分 數學需要的知識主要為 概率論與數理統計 python基礎知...

Python資料分析 Pandas學習

dataframe是乙個類似於 的資料型別,如圖 data 方框內的資料 numpy ndarray structured or homogeneous dict,or dataframe index 行索引索引 index or array like columns 列索引 index or ar...