LSF新增资源池机器并配置队列和群组

LSF新增资源池机器并配置队列和群组

背景:新添加了一批机器,需要放到新的队列(queue)中,并尝试增加一个group

1.将机器加入资源池中

先将机器加到资源池:

Begin Host

HOST_NAME MXJ DISPATCH_WINDOW AFFINITY

default ! () (Y)

b10204 ! () (Y)

End Host

也可以将多个机器放到一个组里,现在创建一个IT的组:

Begin HostGroup

GROUP_NAME GROUP_MEMBER #GROUP_ADMIN # Key words

IT ( b10204 )

End HostGroup

如果有多个机器,也可以这样写:

IT ( b10[201-208] )

机器加入资源池完成

2.将新机器加入新队列

在LSF安装目录/conf/lsbatch/*/configdir/lsb.queues文件中添加如下内容

Begin Queue

QUEUE_NAME = IT

DESCRIPTION = dedicated queue for vpu team

USERS = taizuo01 alatia01

PRIORITY = 30

CORELIMIT = 0

JOB_CONTROLS = SUSPEND[brequeue $LSB_JOBID]

HOSTS = b10204 (新加的机器,也可以使用机器组代替,例如直接写IT)

INTERACTIVE = Y

FAIRSHARE = USER_SHARES[[TOP,100]]

# RES_REQ = select[ut<0.99] order[-mem]

RES_REQ = select[type==any] order[slots:-mem]

# #JOB_STARTER = /*/2.0/prod/sys/lsf_job_starter

REQUEUE_EXIT_VALUES = 199 EXCLUDE(200)

TMP = 500

NEW_JOB_SCHED_DELAY = 0

End Queue

3.给用户定义提交任务时的群组(group)

编辑/*/conf/lsbatch/shenzhen/configdir/lsb.users

Begin UserGroup

GROUP_NAME GROUP_MEMBER # Key words

test (test ) ([default,1])

End UserGroup

4.使配置生效

使用lsf管理员账号执行badmin reconfig,如果有报错,请根据报错修改相对应的文件

5.验证

执行bqueues命令即可看到添加的群组在列表中

相关推荐

〈六〉取得⌈工廠登記⌋教學(2020年更新)
365bet娱乐官

〈六〉取得⌈工廠登記⌋教學(2020年更新)

📅 07-24 👁️ 3180
〈六〉取得⌈工廠登記⌋教學(2020年更新)
365bet娱乐官

〈六〉取得⌈工廠登記⌋教學(2020年更新)

📅 07-24 👁️ 3180
QQ精确查找是什么意思?
bet3365备用

QQ精确查找是什么意思?

📅 08-22 👁️ 2387