資料探勘入門學習心得

2021-10-04 08:07:09 字數 423 閱讀 1946

datawhale 零基礎入門資料探勘—task2 學習心得

很感謝這期學習的舉辦方,作為乙個小白希望可以通這期的學習,可以對這個流程有乙個初步的認識,為以後學習做鋪墊。

2.1 eda目標

eda的價值主要在於熟悉資料集,了解資料集,對資料集進行驗證來確定所獲得資料集可以用於接下來的機器學習或者深度學習使用。

當了解了資料集之後我們下一步就是要去了解變數間的相互關係以及變數與**值之間的存在關係。

引導資料科學從業者進行資料處理以及特徵工程的步驟,使資料集的結構和特徵集讓接下來的**問題更加可靠。

完成對於資料的探索性分析,並對於資料進行一些圖表或者文字總結並打卡。

在**實戰部分,我是去通過在跑一遍大佬的**,然後自己加注釋,去達到乙個理解的過程。在這過程中發現自己還有很多東西要去學習的。

Spring入門學習 心得

可以通過如下途徑入門spring 1 看 spring 開發指南 夏昕v0.8預覽版 2 看 輕量級 j2ee 企業應用實戰 struts spring hibernate 整合開發 李剛所著 3 看 spring framework開發參考手冊 4 還可以看看spring 學習的中文論壇 http...

MapReduce入門學習心得

mapreduce的入門課程心得 1.磁碟的讀寫速度成為瓶頸。光資料載入就會耗去大量時間。2.產生的中間結果也必須放到外部儲存裝置上,磁碟讀寫的速度又一次耗時。3.對中間結果的彙總需要將外部儲存的中間結果再一次讀入記憶體。所以將檔案分散到大量機群中進行並行處理,能夠大大減少硬碟讀寫問題造成的影響。那...

Hadoop入門學習心得

hadoop入門學習心得 網際網路的快速發展帶來了資料快速增加,海量資料的儲存已經不是一台機器所能處理的問題了。hadoop的技術就應運而生。在看了超人學院吳超老師的講解之後,對這個概念有了乙個比較系統的了解。可以講hadoop的核心內容看作是兩個部分,乙個是分布式儲存,乙個是分布式計算。對於分布式...