torque文档--torqueAdminGuide
《Torque文档--torqueAdminGuide》是一份由Adaptive Computing Enterprises, Inc.编写的关于Torque资源管理器(ResourceManager)的管理员指南。Torque是一个开放源码的高性能计算(HPC)集群调度系统,该指南适用于9.0.1版本,为管理员提供安装、配置和管理集群资源的方法。文档内容广泛,涵盖了从基本安装到高级配置的各个方面,尤其适用于需要在NUMA系统上部署和优化集群的场景。 文档首先提供了关于Torque基本架构的概述,包括ResourceManager的安装流程、计算节点的配置以及服务初始化和服务器配置。在安装部分,管理员可以了解到如何安装Torque资源管理器,并根据服务器和节点的具体需要进行定制安装。例如,服务器节点文件配置、基本节点规格设置以及虚拟处理器数和GPU数量的指定,这些都是Torque安装过程中需要考虑的关键参数。 管理员指南还介绍了一些高级配置选项,包括如何为NUMA系统配置Torque,包括NUMA感知配置和NUMA支持配置。这是为了保证Torque能够有效利用多核和多处理器服务器的特性,提高系统整体的计算效率。另外,管理员还可以学习到如何设置和配置Torque的多个MOM(Machine Oriented Monitor)实例,以适应多MOM模式下的集群环境。 关于作业提交和管理部分,文档提供了作业提交的基本知识,例如如何提交作业、如何管理多节点作业以及如何请求各种类型的资源(包括NUMA感知资源、通用资源、浮点资源和其他资源)。此外,Torque提供了多种工具来协助管理员和用户请求资源,以及初始化和配置服务器上运行的PBS Server(PBS服务器)。 在安全性方面,管理员可以了解如何配置trqauthd,以确保客户端命令的安全性。trqauthd是Torque的一个组件,用于处理用户认证,使得资源管理器能够执行授权验证。 文档还强调了在商业目的下,无论是硬拷贝还是软拷贝形式,未经Adaptive Computing Enterprises, Inc.的书面同意,都严禁对此文档进行分发。此外,文档中提及的所有公司和产品名称,除非另有说明,可能都是其各自公司的商标。 总结来说,这份管理员指南为集群管理员提供了一套完整的Torque资源管理器安装、配置和管理的知识体系。通过遵循指南中的步骤和建议,管理员能够确保集群资源得到有效管理和优化。此外,指南还通过介绍如何为特定硬件架构(如NUMA系统)进行定制配置,来展示Torque的灵活性和可扩展性。这份文档是理解和掌握Torque集群调度系统核心功能的宝贵资源,尤其适合那些希望提升集群性能的专业IT人员。




































剩余403页未读,继续阅读


- 粉丝: 3
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 基于微课的翻转课堂在中职计算机教学中的应用与创新.docx
- 电力系统潮流分析计算的MATLAB仿真周明亮01.doc
- 现场签证管理作业指引.doc
- 基于单片机的数控稳压电源毕业设计.doc
- 国家重点研发计划项目答辩评审表格.doc
- 中餐布草送洗程序及标准.pdf
- 小学数学深度学习的实践探索-(4).doc
- 基于Android的2048游戏的设计与实现.doc
- 基于matlab的IIR滤波器的设计文献综述.doc
- 2003沉积学原理试题及答案.doc
- 三菱PLC的三层电梯控制系统设计.docx
- 基于BP神经网络数学算法的智能照明控制应用.docx
- 电力建设工程质量通病典型缺陷防治.doc
- 信息化教学背景下高职教学管理的现状及对策.docx
- d1200-32离心鼓风机试车方案.doc
- 30m预应力工字梁安装方案.doc


