Skip to content

第四章 运行作业

Info

运行、监视和控制提交给 LSF 的作业。

关于 IBM Spectrum LSF

集群、作业和队列

The IBM Spectrum LSF ("LSF", load sharing facility 的缩写) 软件是业界领先的企业级软件,它跨现有的异构 IT 资源分配工作,以创建共享的、可伸缩的和容错的基础设施,提供更快、平衡、更可靠的工作负载性能并降低成本。

主机

LSF 守护进程

批处理作业和任务

主机类型和主机型号

用户和管理员

资源

作业生命周期

处理作业

提交作业 (bsub)

修改排队的作业 (bmod)

修改正在运行的作业

关于控制作业

LSF 控制分配给主机的作业,以实施调度策略或响应用户请求。

在非共享文件空间中使用 LSF

关于资源预留

设置排队的时间限制

你可以为作业指定排队的时间限制,和合格的排队时间限制,以确保作业不会在 LSF 中挂起太长时间。

监控作业

查看 job 信息

显示资源分配限制

使用 blimits 命令显示资源分配限制。