pandas中有關機器學習的一些知識點筆記4

2021-08-22 04:49:42 字數 1673 閱讀 5770

一、這次主要是pandas中的series部分的一些小知識點。

series:就是dateframe中的一行或者一列

dateframe:通過read.csv讀入形成的資料矩陣,由一系列的series結構組成

1.通過series結構對檔案進行讀取

2.讀取檔案進行索引

3.用series進行排序

#1.通過series結構對檔案進行讀取

fandango=pd.read_csv(r"d:\python.code(4)\2-pandas\fandango_score_comparison.csv")

series_film=fandango['film']

print(type(series_film))

print(series_film[0:5])#film列中,0到5行

series_rt=fandango["rottentomatoes"]

print(series_rt[0:5])# rottentomatoes列中,0到5行

#2.讀取檔案進行索引

from pandas import series

film_names=series_film .values

print(type(film_names))

print(film_names)

rt_scores=series_rt.values

print(rt_scores)

series_custom=series(rt_scores,index=film_names)#series將電影名(string)作為索引值

series_custom[['cinderella (2015)','top five (2014)']]

fiveten=series_custom[5:10]

print(fiveten)

#3.用series進行排序

original_index=series_custom.index.tolist()#索引轉化成列表

print(original_index)

sorted_index=sorted(original_index)#進行排序

sorted_by_index=series_custom.reindex(sorted_index)

print(sorted_by_index)

二、對於lambad 的講解:

lambad 表示式就是乙個函式,可以賦值給乙個變數,既然是表示式,可以參與運算。

lambda x: x * 2 這個匿名函式的形參是x,表示式x * 2的值就是這個函式的返回值。

>>> 

lambda x: x ** 2

lambda> at 0x1007f7668>

>>> (lambda x: x ** 2)(2)

4>>> f = lambda x: x ** 2

>>> f(2)

4>>>

map(lambda x: x ** 2, range(1, 11))

結果是。

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]。

也可以這樣 f = lambda x: x ** 2

map(f, range(1, 11))

參考:

numpy中有關機器學習的一些知識點筆記1

這是第一部分關於numpy的一些基本操作 1.檔案的讀取以及help的用法 2.numpy中的核心操作結構array,檢視結構 3.要保證array裡面的元素是同一型別 4.檔案的讀取後的行列的讀取 5.列印多維矩陣的某一列或某一行 從0開始 6.判斷陣列裡面是否有這個值,對每乙個元素進行判斷 7....

林達華推薦有關機器學習的數學書籍

我想國內的大學生都會學過這門課程,但是,未必每一位老師都能貫徹它的精要。這門學科對於learning是必備的基礎,對它的透徹掌握是必不可少的。我在科大一年級的時候就學習了這門課,後來到了香港後,又重新把線性代數讀了一遍,所讀的是 introduction to linear algebra 3rd ...

有關機器學習的 12 個經驗教訓

這篇文章講述了機器學習研究人員和從業人員總結的 12 個關鍵經驗教訓,包括如何避免陷阱,重點問題以及常見問題的答案。機器學習可以通過一些例子,然後從中歸納出規律來解決重要問題。在手動程式設計 硬編碼 不使用的情況下,這種方法通常是非常有效的,而且非常經濟。隨著更多的資料可以使用,我們可以解決更多雄心...