Altair PBS
整合计算资源加以充分利用
整合所有计算资源(包括CPU、内存、磁盘空间、软件license、高速互联等),形成一个虚拟的资源池。借助PBS Professional强大的资源分配和载荷管理功能,用户可以在贯彻用户资源分配/使用政策的前提下,提高计算资源的利用率和作业吞吐量;同时PBS Professional强大的RAS特性能保障计算资源7x24x365不间断地、稳健可靠地运行。
简化作业流程,方便终端用户使用
能够让所有异构的计算资源在终端用户面前呈现一个单一的映像,终端用户不需要关心自己的计算任务怎样被运行的,无需了解计算的环境,如硬件、操作系统、存储空间、应用软件分布情况等。仅需要向PBS提交作业,作业的运行以及计算结果的返回均由PBS来处理,终端用户无需操心自己计算任务之外的工作。
用户能够在局域网内通过的客户端(CMD)界面使用统一的PBS脚本完成作业递交、文件传输、作业监控、作业查询、作业结果回收等工作。
用户也能够利用通用WEB浏览器使用Catalyst在任何地方通过局域网、VPN(虚拟专用网络)、互联网访问算资源。Catalyst能够集成用户各类应用软件(包括用户自编软件),终端用户通过Catalyst菜单就能完成作业递交、文件传输、作业中间结果在线查看、即往作业查询等工作,大大方便了终端用户使用。
PBS能够集成工程计算领域和科学计算领域的各厂商的各类应用软件
仿真分析领域:MSC、ABAQUS Inc、Acusim Software、CD Adapco、Ansoft、Ansys、Fluent、LSTC、ESI Group、Engineous Software、Altair等
生命科学领域:Accelrys、SciTegic、CCDC、OpenEYE、Schrodinger、Tripos、BioSolveIT等
石油物探领域:Permedia、Landmark Graphics、Schlumberger、Paradigm Geo等
PBS能够集成科学计算领域如量子化学、分子动力学、材料科学、气象等各种应用软件有Gaussian、ADF、Molpro、GAMESS、VASP、Wien2K、AMBER、MM5、WRF等。
用户自行开发的应用软件。
可靠性、可用性、可维护性(RAS)
通过pbs自带的图形工具可以直观的监控所有节点的健康状态。
单个PBS Server能够同时管理1000以上用户、20,000以上计算节点(hostname)、10,0000以上CPU、2,000,000以上的作业。
PBS Server/Scheduler Failover
PBS能够自动侦测PBS Server的故障并自动切换至备份的PBS Server。
作业自动迁移
PBS能够自动侦测计算节点的故障,并将作业重新排队或进行Check Point Restart。
支持系统级、应用程序级别Checkpoint/Restart
计算节点访问限制
所有终端用户必须通过PBS才能递交作业。终端用户在无作业运行时,除非经管理员特别允许,无法以任何方式使用或访问任何计算节点。
和各类MPI环境的集成
PBS和MPI环境的紧密集成能够有效地监控MPI作业并对异常作业自动进行及时清理、防止计算节点的过度使用、精确统计CPU运行时间、在作业运行结束后自动清理作业中间文件。针对某些并行环境如LAM和Open MPI,还能够显著提高作业启动时间。目前PBS紧密集成的MPI环境包括:MPICH、MPICH2、MPICH-GM/MX、LAM 6.5.X、LAM 7.X、MVAPICH、IBM POE on HPS switch、HP MPI、SGI MPT、Intel MPI、Scali MPI-Connect。
系统开放性:
l 兼容POSIX 1003.2d批处理标准
l 提供大量的API接口和开发文档,允许用户根据自身需要进行封装
l 独立的调度模块,可选用第三方调度器或自定义调度器替代PBS调度器