AWS搭建Condor彈性計算平台

1.選擇乙個ami，建立乙個autoscaling組，在autoscaling組中可以設定最小機器數量，最大機器數量。autoscaling組中擴充套件機器時，是按照剛開始的ami建立新機器的。

2.在aws的服務裡選擇->cloudwatch,如圖，選擇乙個指標，這裡選擇sqs，選擇指標，這裡選擇的是接收的訊息數量，填上警報名稱和描述，在操作的區域選擇當此警報正常時傳送通知到某個擴充套件策略或縮小策略，然後建立警報

3.為autoscaling組新增擴充套件策略，執行策略的條件是觸發步驟2中的警報，如下圖所示。可以設定每當警報觸發autoscaling擴充套件的數量。

4.到此，aws的service的設定以及全部完畢。這裡要做到的是根據condor的任務情況進行彈性計算，實現方法是檢測condor要處理的任務數量，當任務數量大的時候，向sqs發訊息觸動警報，autoscaling組自動擴充套件；當任務數量小的時候，向sqs發訊息觸發另乙個縮小的策略。在condor_master機器通過condor_status和condor_q這兩個命令的輸出做監控的工作。

這裡的做法如下：

condor_status | grep slot > filename.txt //把condor_status中跟機器相關的輸出寫到filename.txt中

cat filename.txt | wc -l//統計現在condor集群中現存的機器數量

同理，也能統計出等待的任務數量，當等待的任務數量/現存的機器總數超過某乙個數，就可以向sqs傳送訊息

5.condor_master的ec2向sqs傳送訊息的方法在下面連線中有詳述

步驟5中的python命令列（向名字為queue-name的佇列發訊息）綜合起來如下：

步驟4中統計現存的機器總數的python**行如下，原理是跟機器數量相關的行寫入testxx.txt檔案，然後用cat統計出行數賦值給乙個記錄行數的變數即可：

AWS搭建Condor彈性計算平台

基於AWS搭建分布式計算環境

AWS 雲計算

從AWS雲服務開始學習彈性設計

AWS搭建Condor彈性計算平台

基於AWS搭建分布式計算環境

AWS 雲計算

從AWS雲服務開始學習彈性設計

相關推薦