python資料分析1

2021-10-08 15:21:44 字數 1239 閱讀 1387

在github上發現了乙個不錯的教程:

雖然是全英文的,找了下沒有翻譯的版本,但還是決定看這個。

寫個部落格記些筆記。

昨天晚上看了第一張引子,大概說了下為啥用python,jupyter,他們的好處和新特性,以及如何安裝,沒有啥特別的,中文講這內容的很多。

1.1

直接通過anaconda可以開啟jupyter

右上角new可以新建乙個notebook,教程中用了「通過ipython kernel」,這個詞糾結了下,但似乎沒啥影響

也可以新建乙個終端,但我在終端裡列印hello world 報錯:無法初始化裝置prn

暫沒解決,先不糾結

!dir 直接執行shell命令

magic commands 通過 %lsmagic 檢視

例如

%%writefile test.txt

hello world!

writing test.txt

# let's check what this file contains.

with open('test.txt', 'r') as f:

print(f.read())

hello world!

這樣可以建立乙個文字並寫入內容

加問號獲得幫助,比如:%run?

其他的一些工具介紹:

nbconvert

nbviewer

jupyterlab

nteract

hydrogen

juno

其中有的教程後面可能會涉及

1.2 這節以乙個例子為例講了幾個函式

先import

在從乙個url裡獲得csv的資料

describe()函式可以獲得一些常規統計值

然後畫兩條街的數量折線圖

按星期統計彙總每條街的數量 groupby

其中發現日期格式的index,沒有weekday_name這個屬性,只有weekday,有時間查下原因

然後畫彙總好的各個街的折線圖

最後乙個例子沒看明白,用@interact把第一張圖變得平和

1.3這節是通過幾個運算來說明numpy的運算速度優於python

例子沒耐心乙個個敲一遍了

最後原理也懶得看透,跟我學的內容關係不大,看英文畢竟累。

學習目的更直接簡單些,不要為了「完美」拖了程序。

python資料分析1

1.3檢視列 行 單元格 為啥要用python中的pandas庫進行資料分析,用excel不可以嗎?不可以,excel處理上萬條資料時通常會宕機或者出錯,python不會有這種問題。相信鯉魚學長,在學習乃至日後工作中,pandas庫將會風靡相當長一段時間。示例 pandas 是基於numpy 的一種...

python資料分析基礎1

filter 函式用於過濾序列,過濾掉不符合條件的元素,返回由符合條件元素組成的新列表 接收兩個引數,第乙個為函式,第二個為序列,序列的每個元素作為引數傳遞給函式進行判斷,返回true或false,將返回true的元素放到新列表中。def ou n if n 2 0 return true else...

小白學 Python 資料分析(1) 資料分析基礎

人工植入廣告 ps 小編最近兩天偷了點懶,好久沒有發原創了,最近是在 csdn 開通了乙個付費專欄,用來發布去年寫的沒有出版的書稿,感興趣的同學可以去看下 已經上傳了一部分,第一章設定為了試讀章節 主要是講 springcloud 微服務方面的一些內容,整體排版下來如果是印在實體書上應該會超過 40...