想從事大資料工作,如何自學打基礎

2021-06-22 13:01:58 字數 558 閱讀 1257

海量資料分成兩塊,一是系統建設技術,二,海量資料應用。

先說系統建設,現在主流的技術是hadoop,主要基於mapreduce的分布式框架。目前可以先學習這個。但是我的觀點,在分布式系統出來之前,主要是集中式架構,如db2,oracle。為什麼現在用分布式架構,那是因為現在集中式架構受限於io效能,出來速度慢,如果又一種硬體技術,可以很快地處理海量資料,效能上能滿足需求,那麼集中式架構優於分布式架構,因為集中式架構穩定,運維壓力小。現在的集中式架構要麼效能達不到要求,要麼就是過於昂貴。我期待一種技術出現,可以非常快地傳輸和處理資料,那麼集中式架構將再次進入人們眼球。再說海量資料應用。海量資料應用主要是資料探勘和機器演算法。具體有不同的應用場景,如個性化搜尋和推薦,社交網路發現,精準營銷,精準廣告,實時最優路徑,人工智慧等等。看你想做系統支撐技術還是與業務結合的應用技術。

如果現在學系統建設技術,可以讀下如下書籍:

如果學資料探勘和機器演算法,推薦先看資料探勘導論,統計分析原理,mahout,r,matlab

想從事DBA工作,該挑選哪一款資料庫產品

知乎問這原題 現在主流資料庫有很多,作為乙個學生以後想從事dba的工作,應該學哪一種呢?標題修改為 想從事dba工作,該如何挑選一款資料庫產品 mysqlops回答 不管你想選擇哪種資料庫產品,有些基礎理論知識必須打紮實,尤其是 資料庫系統概論 linux作業系統 sql標準語言 資料結構 重點排序...

從事大資料分析工作需要具備哪些技能?

大資料時代已經來臨,對複雜凌亂的資料進行整合分析,獲取有用的資訊,去支撐政策的制定 決策的形成以及工作的完成,必將成為未來決策重要的手段!從事大資料工作的職位可稱之為大資料工程師,大資料工程師 往往不是乙個人,而是乙個團隊,它意味著從資料的收集 整理展現 分析和商業洞察 以至於市場轉化的全過程。這個...

大專生自學大資料到找到工作的前前後後

先做個自我介紹,我13年考上一所很爛專科民辦的學校,學的是生物專業,具體的學校名稱我就不說出來獻醜了。13年我就輟學了,我在那樣的學校,一年學費要1萬多,但是根本沒有人學習,我實在看不到希望,我就退學了。退學後我也迷茫,大專都沒有畢業,我真的不知道我能幹什麼,我在糾結著我能做什麼。所以輟學後我一段時...