CDALEVEL 大資料分析師

2021-10-12 20:59:21 字數 1291 閱讀 8069

1.大資料分析基礎 1%

2. python 基礎 5%

3. linux & ubuntu 作業系統基礎 2%

hadoop 安裝配置及執行機制解析 2%

hdfs 分布式檔案系統 2%

mapreduce 理論及實戰 2%

hadoop 生態其他常用元件 6%

資料庫導論 2%

mysql 理論及實戰 3%

hbase 安裝及使用 3%

hive 安裝及使用 5%

sqoop 安裝及使用 3%

資料探勘的基本思想 2%

資料探勘基本方法介紹 2%

有監督學習演算法 4%

無監督學習演算法 2%

spark 基礎理論 2%

b. spark rdd 基本概念及常用操作 3%

c. spark 流式計算框架 spark streaming、structured streaming 5%

d. spark 互動式資料查詢框架 spark sql 5%

e. spark 機器學習演算法庫 spark mllib 基本使用方法 15%

f. spark 圖計算框架 graphx 5%

a. 資料視覺化入門基礎 1%

b. python 資料視覺化入門 2%

c. python 高階資料視覺化方法 1%

a. 利用 hdfs shell 操作 hdfs 檔案系統 1%

b. 利用 hive sql 進行資料清洗 2%

c. 利用 sqoop 進行資料傳輸 1%

d. 利用 spark sql 進行資料讀取 2%

e. 利用 spark mllib 進行機器學習建模 8%

f. 利用 python 進行建模結果資料視覺化 1%

[1] jake vanderplas. python 資料科學手冊[m]. 人民郵電出版社,2018.(必讀)

[2] tom white. hadoop 權威指南(第三版)[m]. 清華大學出版社, 2015.(必讀)

[3] 王雨竹,高飛. mysql 入門經典[m]. 機械工業出版社,2013.(必讀)

[4] pang-ning tan 等. 資料探勘導論[m]. 人民郵電出版社,2011.(必讀)

[5] 林子雨等. spark 程式設計基礎[m]. 人民郵電出版社,2018.(必讀)

[6] hold karau 等. spark 快速大資料分析[m]. 人民郵電出版社,2015. (必讀)

[7] sandy ryza 等. spark 高階資料分析[m]. 人民郵電出版社,2015. (選讀)

大資料分析師養成記

以下是一位在資料分析領域打滾了n年後,寫下的一些體會,一定能給新人一些借鑑的地方。總結的不錯,大家可以借鑑學習哦 一 資料分析師有哪些要求?1 理論要求及對數字的敏感性,包括統計知識 市場研究 模型原理等。2 工具使用,包括挖掘工具 資料庫 常用辦公軟體 excel ppt word 腦圖 等。3 ...

大資料分析師「錢途」無量

大資料時代已經到來,人類開始進入商務智慧型化時代。如火如荼的大資料行業催生了一項與資料處理相關的職業 大資料分析師,後者通過對資料的挖掘分析來影響企業的商業決策。大資料分析師是幹嘛的?大資料分析師就是一群玩資料的人,玩出資料的商業價值,讓資料變成生產力。阿里巴巴集團研究員薛貴榮曾如此概述。大資料分析...

大資料分析師的卓越之道

大資料時代的資料分析區別於普通的資料分析,這是由大資料的特性所決定的,為了適應大資料的時代的發展,資料分析師也應該轉變一些分析的思想和觀念。大資料時代的要求 資料需要流動起來才有價值 大資料典型的場景 當資料量 基礎設施以及資料價值逐漸變大時,對知識挖掘和發現的方法也需要不斷的改進。在量子論的世界裡...