slurm mysql slurm系統管理

2021-10-19 22:35:42 字數 2855 閱讀 5801

slurm 系統管理

使用slurmdbd進行記賬管理,首先需要安裝mysql服務

$ sudo apt-get install mysql-server

$ sudo apt-get install libmysqlclient-dev

使用原始碼安裝slurm

$ cd slurm

$ ./configure --prefix=/usr --sysconfdir=/etc/slurm

$ make

$ sudo make install

如果需要開機啟動,將slurm/etc資料夾下的 init.d.slurm拷貝到/etc/init.d/slurm中,

對於ubunt系統,需要在init.d.slurm中修改,其中的/etc/rc.d/init.d/functions修改為

『/lib/lsb/init-fuctions』即可,對於slurmdbd服務,將slurm/etc/init.d.slurmdbd拷貝到 /etc/init.d/slurmdbd中,與init.d.slurm做同樣的修改。

然後需要修改slurm.conf和slurmdbd.conf檔案,將其拷貝到/etc/slurm資料夾下。

修改完以後對slurm.conf和slurmdbd.conf進行修改

對slurm.conf的修改部分

accountingstoragetype=accounting_storage/slurmdbd

accountingstorageuser=slurm

accountingstorejobcomment=yes

新增slurmdbd.conf

authtype=auth/munge

dbdaddr=localhost

dbdhost=localhost

#dbdport=7031

slurmuser=slurm

#messagetimeout=300

debuglevel=4

#defaultqos=normal,standby

logfile=/var/log/slurm/slurmdbd.log

pidfile=/var/run/slurmdbd.pid

#plugindir=/usr/lib/slurm

#privatedata=accounts,users,usage,jobs

#trackwckey=yes

storagetype=accounting_storage/slurmdbd

storagehost=localhost #mysql所在的伺服器

storageport=1234 #埠

storagepass=password #登入密碼

storageuser=slurm #使用者

#storageloc=slurm_acct_db

在mysql中建立相應的使用者

$ mysql -u root -p

mysql> insert into mysql.user(host,user,password) values("localhost","slurm",password("password"));

mysql>grant all on slurm_acct_db.* to 'slurm'@'localhost';

然後就可以啟動slurm和slurmdbd服務了

$ sudo /etc/init.d/slurm start

$ sudo /etc/init.d/slurmdbd start

sacctmgr管理

使用sacctmgr可以將使用者關聯到不同的集群,賬戶上,sacctmgr可以管理多個集群,首先應通過sacctmgr命令

1. 向記賬資料庫中新增所管理的集群資訊

# sacctmgr add cluster name=name [option=value]

option 包括集群類別,公平份額,資源限制,qos等設定

可以通過sacctmgr list cluster檢視集群資訊,修改集群資訊可以如下

# sacctmgr modify cluster where name=clustername set modifyattribute=value

刪除# sacctmgr delete cluster clustername向記賬資料庫新增賬戶,賬戶為系統對使用者的一種組織方式,可以通過將同一單位或者組織的使用者新增到同乙個

賬戶中來實現對該單位或者組織使用集群的資源作出限制,在賬戶中還可以新增子賬戶,新增賬戶

# sacctmgr add account name=accountname [option=value]

option 包括集群,組織單位,描述,父帳號,公平份額,資源限制,qos

賬戶也可以通過對應的命令進行修改和刪除

3. 向記賬資料庫中新增使用者,當slurm.conf中accountingstorageenforce設定為 associations時,

只用新增到記賬資料庫中的使用者才能向集群提交作業。新增使用者

# sacctmgr add user name=username [option=value]

option 包含集群,賬戶,預設賬戶(乙個使用者可以天到多個賬戶中),負載特性,分割槽,管理級別,公平份額,資源限制,qos

作業的qos

qos為服務質量,由系統管理員定義,命名,然後在使用者使用時通過名字使用不同的qos。qos可以進行資源限制,作業提交檢查,如限制提交作業數,限制節點或者處理器數,執行時間限制等,作業排程檢查,超出qos限制的作業不能執行,作業執行中檢查等。建立qos

# sacctmgr add qos qosname where value=value

使用者在提交作業時可以選擇qos,如未指定,使用賬戶關聯的qos,否則使用預設qos。

SAP BASIS系統管理

系統監控 1 sm51 2 sm50 3 sm66 系統日誌 1 sm21 sap ccms 1 rz20 2 st06 作業系統監視器 operating system monitor 用於分析整個sap技術棧的效能 4 ssaa 用於執行常規的日 周和月的系統管理功能。5 smlg 用於監控sa...

Oracle 系統管理

oracle 系統管理 1.oracle的啟動和關閉 說明 這裡所說的啟動和關閉是對於 oracle 例項而言,而不是對於 oracle 服務而言。如果 oracleserviceorcl 服務未開啟,則會報 ora 12560 tns 協議介面卡錯誤 而且啟動和關閉需要有 dba許可權才能操作,否...

UNIX系統管理

一 進場管理 1 查詢程序執行狀況 ps 命令 解釋ps e 列出正在執行的程序 ps f 列出程序的詳細資訊 ps uomc 列出 omc使用者的程序 ps l 顯示程序最詳細的資訊 ps l 顯示結果 f s uid pid ppid c pri ni addr sz wchan tty tim...