第四章 运行作业¶
Info
运行、监视和控制提交给 LSF 的作业。
关于 IBM Spectrum LSF¶
集群、作业和队列¶
The IBM Spectrum LSF ("LSF", load sharing facility 的缩写) 软件是业界领先的企业级软件,它跨现有的异构 IT 资源分配工作,以创建共享的、可伸缩的和容错的基础设施,提供更快、平衡、更可靠的工作负载性能并降低成本。
主机¶
LSF 守护进程¶
批处理作业和任务¶
主机类型和主机型号¶
用户和管理员¶
资源¶
作业生命周期¶
处理作业¶
提交作业 (bsub)¶
修改排队的作业 (bmod)¶
修改正在运行的作业¶
关于控制作业¶
LSF 控制分配给主机的作业,以实施调度策略或响应用户请求。
在非共享文件空间中使用 LSF¶
关于资源预留¶
设置排队的时间限制¶
你可以为作业指定排队的时间限制,和合格的排队时间限制,以确保作业不会在 LSF 中挂起太长时间。
监控作业¶
查看 job 信息¶
显示资源分配限制¶
使用 blimits 命令显示资源分配限制。