大資料八斗九期學習

2021-09-24 18:30:16 字數 515 閱讀 1605

經過了幾個月的學習 功力大增

/*

開學典禮/常見業務架構

整體結構+mapreduce+pyweb

文字相似度.

中文分詞

中文分詞

推薦演算法

分類演算法-nb

分類演算法-邏輯回歸

分類演算法-多分類

推薦系統demo

推薦系統+簡歷面試

yarn+hdfs

yarn+spark

spark實踐

hive

hive

hbase

flume

kafka

storm+zookeeper

spark streaming

spark sql

logserver

kmeans

深度學習

決策樹+模型融合*/

需要點我提取:nki0

寒假大資料學習筆記九

2 建立scrapy專案 這是很麻煩的一步,因為pycharm沒法建立scrapy專案,所以無論是windows還是linux都需要使用命令建立,可以使用命令scrapy檢視所有的scrapy可使用命令。scrapy genspider 專案名 網域名稱 切換到想建立專案的的位置,輸入以上命令即可。...

大資料 八 Sqoop

sqoop是什麼 sqoop sql to hadoop 連線 傳統關係型資料庫 和 hadoop 的橋梁 把關係型資料庫的資料匯入到 hadoop 系統 如 hdfs hbase 和 hive 中 把資料從 hadoop 系統裡抽取並匯出到關係型資料庫裡。利用mapreduce加快資料傳輸速度 將...

大資料 Spark(八)

dag directed acyclic graph 叫做有向無環圖 有方向,無閉環,代表著資料的流向 原始的rdd通過一系列的轉換就形成了dag。下圖是基於單詞統計邏輯得到的dag有向無環圖 乙個job會被拆分為多組task,每組任務被稱為乙個stage。stage表示不同的排程階段,乙個spar...