《利用Python做資料分析》學習筆記(一 二)

2021-08-14 08:43:27 字數 565 閱讀 1279

這一章主要介紹了一些和資料分析相關的重要python庫,包括numpy、pandas和matplotlib,然後有編譯環境ipython。之後講了一些準備工作,包括epd(現在更新為了enthought canopy)的安裝、pandas的安裝。都是一些準備工作,比較簡單。

第二章 引言

之前學習《learn python the hard way》,習慣了小步前進的節奏,突然上來跟了些**,完全摸不著頭腦,於是去網上看了一下別人的學習筆記,發現大家都是跟著敲**走的。這一章主要是用三個簡單的例子介紹了python在資料處理方面的大體功能。

1、來自bit.ly的1.usa.gov資料。

(1)列表推導式:records = [json.loads(line) for line in open(path)]

(2)分別用python**和pandas對時區數進行計數。

(3)對統計資料畫圖。

2、movielens 1m資料集

3、1880-2023年間全美嬰兒姓名資料的處理。

從內容中可以看出,都是在給定資料的前提下,教大家怎麼使用python包對資料進行分類、處理和表達。

利用python做資料分析

3.2 資料分析的目的 主要就是為了在複雜 龐大的資料庫中提取對我們有用的資訊。讓這些資料產生一定的價值,幫助人們在日常生活中做一些決策時做一些參考。比如,在 中買東西,我們會首先看到物品的銷量 排行 以及顧客對物品的評價。這些都是經過資料分析得出來的。可見,資料分析在其中扮演著多麼重要的角色。3....

利用python做資料分析 五 讀取合併多個檔案

pieces columns name births for year in range 1880,2011 path c users ecaoyng desktop work space python py for analysis pydata book master ch02 names yo...

利用python做資料分析 五 讀取合併多個檔案

pieces columns name births for year in range 1880,2011 path c users ecaoyng desktop work space python py for analysis pydata book master ch02 names yo...