集群上作業提交系統LSF和PBS的使用與簡介

2021-10-03 22:12:56 字數 1368 閱讀 8597

bkill:刪除作業

bjobs:檢視作業

bqueues:檢視佇列資訊

pbs作業提交系統

qdel:刪除作業

qstat:顯示作業狀態

pbsnodes:顯示集群中所有節點資訊

#bsub -n num

#bsub -l nodes=1:ppn=1

#bsub -q queue

#bsub -o path

#bsub -e errorpath

#bsub -j jobname

#bsu -i

-n:指定num為計算核心數

-q:指定queue佇列

-o:將標準輸出重定向到path

-e:將標準錯誤資訊重定向到errorpath

-j:指定jobname為作業名稱

-i:互動模式

刪除作業12345:

bkill 12345

pbs是乙個作業排程系統,常用於分布式高效能計算集群的作業管理。

在集群上使用qsub run.pbs提交作業,run.pbs一般包括這些資訊:

#pbs -n jobname

#pbs -l nodes=1:ppn=1

#pbs -q queue

#pbs -o path

#pbs -e errorpath

#pbs -l walltime=800:00:00

cd ./home/myjob

./job

-n:指定jobname為作業名

-l:用來定義資源列表,nodes=1指定該作業執行的節點數量為1,ppn=1指定每個節點需要1個cpu。walltime指定作業執行時間,800:00:00代表800個小時。

-q:指定queue佇列

-o:將標準輸出重定向到path

-e:將標準錯誤資訊重定向到errorpath

最後兩行是進入作業目錄並執行該作業

刪除作業12345:

qdel 12345

強制刪除作業12345:

qdel -p 12345

15s後刪除作業12345:

qdel -w 15 12345

檢視所有作業:

qstat -q

檢視作業12345:

qstat -f 12345

檢視閒置節點:

pbsnodes -l free

集群LSF作業提交系統Bsub命令使用

bsub,提交給lsf作業的命令。1.命令格式 bsub options command argument bsub pack job submission file 2.引數含義 q 選擇佇列 i 指定輸入檔案 i 互動模式,此時終端不能輸入 o 指定輸出檔案,作業提交後標準輸出的資訊會儲存到這個...

LSF集群作業管理系統

lsf load sharing facility 是乙個被廣泛使用的作業管理系統,具有高吞吐 配置靈活的優點。通過 lsf 集中監控和排程,可以充分利用計算機的cpu 記憶體 磁碟等資源。可以通過以下三種方法使用 bsub 來提交作業 直接在命令列中輸入完整引數 進入 bsub 環境互動提交 編寫...

作業系統概念上的作業

1 os作為使用者與計算機硬體系統之間的介面 2 os作為計算機系統資源的管理者 3 os實現了對計算機資源的抽象 1 與硬體的關係 作業系統是位於硬體層上的第一層軟體,它直接管理著計算機的硬體,合理組織計算機工作流程,並提高了硬體的利用率。2 與其他系統軟體的關係 作業系統是系統軟體,但它不同於其...