大資料工程師學習大綱彙總

2021-07-11 06:11:25 字數 845 閱讀 1839

最近有不少同事朋友問我,學習大資料應該學習哪些技能,我查閱相關資料,做了個大體彙總,方便感興趣的讀者閱讀。

flink

hadoop

mesos

spark mlib

tensorflow (google 系)

amazon machine learning

dmtk (微軟分布式機器學習工具)

hive

kylin

spark sql,

spark dataframe

impala

phoenix

elk

rocketmq

zeromq

activemq

rabbitmq

spark streaming

flume

python

rruby

spss

sas

d3.js

echarts

excle

時間序列

推薦系統

回歸分析

文字挖掘

決策樹支援向量機

貝葉斯分類

神經網路

spark mlib

tensorflow (google 系)

amazon machine learning

dmtk (微軟分布式機器學習工具)

raft

gossip

雜湊表二叉樹,紅黑樹,b樹圖

最大子陣列

最長公共子串行

最小生成樹

最短路徑

矩陣的儲存和運算

openstack

docker

大資料工程師 學習路徑

hadoop來自於谷歌mapreduce的程式設計模型包。mapreduce框架把應用程式分解為平行計算指令,跨大量節點執行非常大的資料集。典型例子是搜尋演算法。hadoop最初與網頁索引有關,迅速發展成為分析大資料的領先平台。如果你想成為大資料工程師,卻不知從何學起 找不到系統的課程和專案進行學習...

Linux運維工程師學習大綱

一 熟悉linux系統基本知識 1.linux基本概念 2.學習linux使用者管理和檔案結構部分 3.熟悉linux日誌檔案 4.熟練使用vi工具 5.了解cron job 6.了解swap交換區 7.了解系統啟動過程 二 linux的安裝與配置 1.安裝linux並合理規劃作業系統空間 2.服務...

演算法工程師學習流程

1.完成機器學習基礎的學習 機器學習方面的知識是演算法工程師區別於普通程式設計師的核心。這部分知識要重點掌握。1 學習資料 以林軒田的 機器學習基石 機器學習技巧 為主,以周志華的 機器學習 李航的 統計學習方法 為輔。2.練習 刷完 劍指offer 大概50題,最後可以手寫 並進行一些基本的邏輯訓...