两台 centos 7.9 部署 pbs version 18.1.4 集群
在 CentOS 7.9 上部署 PBS (Portable Batch System) 版本 18.1.4 的集群涉及多个步骤,包括安装 PBS 软件、配置 PBS 服务、设置用户权限以及测试集群功能。以下是一个详细的步骤指南:
步骤 1: 安装 PBS Pro
首先,确保所有节点(包括服务器和计算节点)都安装了 CentOS 7.9。然后,你需要从 PBS 的官方网站下载 PBS Pro 的安装包。
下载安装包:
访问 PBS 的官方网站,下载适合 CentOS 的 PBS Pro 版本。通常,你可以选择 RPM 包或源代码包。
安装 PBS Pro:
在服务器节点上,使用以下命令安装 PBS Pro:
sudo yum localinstall pbs_pro-.x86_64.rpm
替换 为你下载的版本号。
步骤 2: 配置 PBS
配置服务器:
编辑 /var/spool/pbs/server_name 文件,设置服务器名称。
sudo vim /var/spool/pbs/server_name
输入你的服务器名。
配置节点文件:
编辑 /var/spool/pbs/server_priv/nodes 文件,列出所有计算节点的信息。例如:
node1 slots=8 state=free
node2 slots=8 state=free
启动 PBS 服务:
sudo systemctl start pbs_server
sudo systemctl enable pbs_server
步骤 3: 配置客户端和用户权限
创建用户:
为 PBS 创建一个新用户或使用现有用户。例如,创建一个名为 pbsadmin 的用户:
sudo useradd -m pbsadmin
sudo passwd pbsadmin
设置权限:
确保 pbsadmin 用户有适当的权限来提交和管理作业。你可能需要设置 pbsadmin 为管理员或特定组的成员。
步骤 4: 测试 PBS 集群
登录为 pbsadmin:
su - pbsadmin
提交测试作业:
使用 qsub 提交一个简单的作业测试 PBS 是否正常工作。创建一个脚本文件 test.sh:
#!/bin/bash
echo “Hello from PBS” > output.txt
然后提交作业:
qsub test.sh
检查作业状态:
qstat
查看作业是否在队列中运行。使用 qdel 可以取消作业。
步骤 5: 监控和调试
查看日志:检查 /var/log/pbs.log 和 /var/log/pbs_mom.log 以获取任何错误或警告信息。
调试问题:如果遇到问题,确保所有节点的网络连接正常,以及 PBS 的配置文件正确无误。
通过以上步骤,你应该能够在 CentOS 7.9 上成功部署并运行 PBS Pro 18.1.4 集群。如果遇到具体问题,可以查看 PBS 的官方文档或联系技术支持获取帮助
