Hadoop排程框架

2022-02-17 04:43:17 字數 1244 閱讀 3932

大資料協作框架是乙個桐城,就是hadoop2生態系統中幾個輔助的hadoop2.x框架。主要如下:

hadoop排程框架

quartz排程框架,但是多個作業時,缺點就出來了。

linux  crotab

是針對每個使用者而言。

crontab -e 就是加任務

規則如下:

*   *   *   *   *   cmd

前面的五個*分別是表示設定的時間,即分鐘、時、天、月和星期。然後cmd就是代表具體的命令。

比如:

crontab -e

## first crontab

*/1 * * * * /bin/date >> /home/hadoop/date.log

這個date.log是我們自己新建的。

檢視任務

crontab -l

刪除任務

crontab -r

針對hadoop任務作業排程

針對mr怎麼來寫呢

我一般喜歡把myeclipse或eclipse那邊打好的jar包,放到/home/hadoop/jar目錄下

針對hive怎麼來寫呢

hive-select-log.sql是我們自己寫好的sql指令碼

針對sqoop怎麼來寫呢

sqoop-imoort.txt是我們自己寫好的指令碼

針對shell script怎麼來寫呢

bin/sh  ***.sh

先寫好hive,再寫好sqoop指令碼

這裡,我重點使用oozie和azkaban。

Hadoop的排程器

隨著mapreduce的流行,其開源實現hadoop也變得越來越受推崇。在hadoop系統中,有乙個元件非常重要,那就是排程器,它的作用是將系統中空閒的資源按一定策略分配給作業。在hadoop中,排程器是乙個可插拔的模組,使用者可以根據自己的實際應用要求設計排程器。hadoop中常見的排程器有三種,...

Hadoop作業排程演算法

hadoop集群中有三種作業排程演算法,分別為 fifo 公平排程演算法和計算能力排程演算法 fifo比較簡單,hadoop 中只有乙個作業佇列,被提交的作業按照先後順序在作業佇列中排隊,新來的作業插入到隊尾。乙個作業執行完後,總是從隊首取下乙個作業執行。這種排程策略的優點是簡單 易於實現,同時也減...

Hadoop資源排程器

目前,hadoop作業排程器主要有三種 fifo capacity scheduler和fair scheduler。hadoop2.7.2預設的資源排程器是capacity scheduler。具體設定詳見 yarn default.xml檔案 the class to use as the re...