在 Windows 上为流体/结构工具设置 Ansys 远程求解管理器 (RSM):分步指南
Remote Solve Manager (RSM) 简介
Ansys Remote Solve Manager (RSM) 是一款多功能工具,使用户能够将仿真作业提交到远程集群或高性能计算 (HPC) 系统,从而增强计算工作流程。无论是管理大型模拟还是优化资源使用,RSM 都可以简化作业调度、执行和资源分配。
本指南提供了使用 Ansys 远程集群 (ARC) 作业调度程序在 Windows 计算机上配置 RSM 的分步说明。虽然此示例侧重于 ARC,但 RSM 还支持第三方作业计划程序,如 Platform LSF、PBS Professional、Slurm、Altair Grid Engine 和 Windows HPC。有关与其他调度器兼容性的详细信息,请参阅 Ansys 支持文档。
这些说明特别适用于 RSM for Fluids/Structures 工具。Electronics 工具所需的设置略有不同。有关这些步骤,请在此处参阅我们的专用博客。
方案概述
本教程演示了如何为 RSM 配置多节点 ARC 集群并设置自定义作业调度系统。在此示例中:
- 主节点 (MASTER):处理作业提交和管理。
- 计算节点 (HOST1, HOST2):这些计算机通常是执行模拟的主要工作计算机。在此示例中,我们将假设 HOST1 是一台计算资源有限的小型计算机,而 HOST2 是一台更大的大容量计算机。
第 1 步:使用 ARC 配置管理器创建集群
设置 MASTER 计算机(主节点)
- 登录:使用管理员凭证访问 MASTER 计算机。
- 启动 ARC 配置:
- 导航到 Ansys 202# R# > ARC Configuration 202# R# >开始“,或运行位于 的可执行文件。
[RSM_Install_Location]\ARC\bin\arcConfigConsole.exe
- 导航到 Ansys 202# R# > ARC Configuration 202# R# >开始“,或运行位于 的可执行文件。
- 定义集群用法:
- 选项 1:在同一台计算机(本地队列)上提交、计划和运行作业。
- 选项 2:将作业提交到网络上的主节点,该节点也可以与其他计算节点一起充当执行节点。
- 选项 1:在同一台计算机(本地队列)上提交、计划和运行作业。
- 启动 Master Service:通过配置界面启动 Master Node Service。您可以允许 MASTER 计算机执行作业以获得额外的计算容量,也可以将其限制为仅分配作业。在此示例中,MASTER 节点也被配置为运行作业。
添加执行节点
指定主节点后,下一步是将其他两台计算机作为执行节点添加到集群中。这些节点将处理实际的作业处理。如果之前选择了相应的选项,则主节点也可以作为执行节点参与。配置后,每个节点都将显示在对话框中。通过从列表中选择一个节点,您可以调整其设置,例如限制它可以用于任务执行的最大内核数。这有助于防止过载,并确保至少有 1-2 个 CPU 可用于操作系统的后台任务。同样,当添加其他执行节点时,它们将列在主节点下方,并且可以进行自定义以满足集群的需求。
在此示例中,我们将选择以下设置:
- 指定计算节点:右键单击执行节点,选择“添加执行节点”,然后输入执行节点的名称(在本例中为 HOST1 和 HOST2)。
- 配置资源限制:
- 对于 MASTER 和 HOST1,限制作业可用的最大内核数以防止过载。
- 对于 HOST2,请删除限制以充分利用其容量。
- 启用节点服务:在每个计算节点上启动执行节点服务。
创建自定义队列
作业队列充当虚拟管道,其中使用集群中的可用资源来组织计算任务(作业)、确定其优先级和执行。创建自定义队列允许您根据特定要求优化资源分配,例如,为内存密集型模拟保留高容量节点,或限制计算机上的并发作业数量以防止过载。与默认队列或本地队列相比,自定义队列提供了更大的灵活性和控制力,使其成为有效管理资源和确保根据预定义的优先级处理关键任务的宝贵工具。作为示例,我们将配置一个仅供 HOST2 访问的自定义队列,专门用于处理更大的内存密集型作业。对于较小的集群,默认队列和本地队列通常就足够了。要设置自定义队列,请执行以下步骤。
- 添加队列:右键单击 Queues,选择“Add a queue”,然后将其命名为 。
high_mem
配置队列设置:
- 州:
- 启用:队列处于活动状态,可以接受作业。
- Disabled:队列将拒绝任何传入的作业。
- 暂停:队列可以接受作业,但它们将保留在队列中而不进行处理。
- 优先权:定义此队列中作业相对于其他队列的优先级。优先级较高的队列中的作业将首先执行。优先级别包括:
- 高
- 高于正常
- 正常
- 低于正常
- 低
活动时间范围:选中 “Set Active Time Range” 框以确保队列始终保持活动状态。
Job Limit (作业限制):指定此队列中可以同时运行的最大作业数。在此示例中,我们将限制设置为 100 个作业。
Assign Execute Nodes:通过导航到 Access Control 设置,将特定节点分配给此队列。对于此示例,选择 HOST2 作为指定的执行节点,如下所示。
Save Changes:应用配置。(可选)启用凭证缓存以实现安全作业提交。
步骤 2:配置客户端计算机以提交到集群
要使 RSM 客户端计算机能够将作业提交到 ARC 提交主机 (MASTER),必须在配置的客户端设置一个配置,以在客户端和提交主机之间建立通信,定义文件传输方法,并将 RSM 队列映射到相应的 ARC 集群队列。为此,我们可以按照以下步骤操作。
- 启动 RSM 配置:打开 Ansys 202# R# > Start > RSM Configuration 202# R#。
- 添加 HPC 资源:
- 分配一个名称(例如 ARC),选择 ARC 作为 HPC 类型,然后指定 MASTER 机器名称。需要注意的是,这里 HPC 类型应设置为 ARC,如下所示。这表示我们使用的是刚刚创建的 Ansys 默认作业调度程序。如果您有第三方作业调度程序,则可以从此处列出的可用调度程序列表中选择它。
- 分配一个名称(例如 ARC),选择 ARC 作为 HPC 类型,然后指定 MASTER 机器名称。需要注意的是,这里 HPC 类型应设置为 ARC,如下所示。这表示我们使用的是刚刚创建的 Ansys 默认作业调度程序。如果您有第三方作业调度程序,则可以从此处列出的可用调度程序列表中选择它。
- 设置文件管理:
- 使用 RSM Internal File Transfer Mechanism,并定义暂存目录。这决定了文件如何从 RSM 群集到达易于操作或读取的位置。在此示例中,我们将为“RSM Internal File Transfer Mechanism”选项,该选项需要指定暂存目录。暂存目录是在求解期间/之后写入所有作业文件的位置。当远程 HPC 暂存目录对客户端计算机不可见时,我们使用内部文件传输机制选项。RSM 使用 TCP 套接字将文件从客户端计算机流式传输到提交主机。在这种情况下,您必须指定作业文件将暂存的目录的路径。此目录必须对所有 HPC 节点可见。
- 使用 RSM Internal File Transfer Mechanism,并定义暂存目录。这决定了文件如何从 RSM 群集到达易于操作或读取的位置。在此示例中,我们将为“RSM Internal File Transfer Mechanism”选项,该选项需要指定暂存目录。暂存目录是在求解期间/之后写入所有作业文件的位置。当远程 HPC 暂存目录对客户端计算机不可见时,我们使用内部文件传输机制选项。RSM 使用 TCP 套接字将文件从客户端计算机流式传输到提交主机。在这种情况下,您必须指定作业文件将暂存的目录的路径。此目录必须对所有 HPC 节点可见。
- Import Queues:导入本地队列、默认队列和自定义队列(例如 )。
high_mem
- 测试队列:通过提交测试作业和选择性重命名队列来验证功能,以便清楚起见。
作业诊断和故障排除
通过 RSM 配置工具提交测试作业时,状态栏会提供有关提交和执行进度的实时更新。完成后,无论作业是成功还是失败,都会提供详细的诊断报告。此报告包含用于故障排除的关键信息,并确保配置设置正确。
第 3 步:与用户共享配置
选项 1:集中共享
- 创建共享目录:示例路径:.
C:\SharedRSMConfig\ANSYS\v2##\RSM
- 复制文件:将 和 传输到共享目录。
ARC.rsmcc
queues.rsmq
- 分发路径:与用户共享目录路径以实现无缝集成。
选项 2:本地副本分发
- 分发配置文件:为用户提供复制到其本地目录所需的文件。
- Windows 路径: .
%APPDATA%\ANSYS\v2##\RSM
- Windows 路径: .
遵循这些步骤可确保 Ansys RSM 的稳健和高效设置,使用户能够最大限度地提高仿真性能并简化计算工作流程。
第 4 步:如何在 Mechanical/Fluent 中配置
现在我们已经设置了 RSM 配置,我们可以查看如何在 Mechanical 或 Fluent 中将作业提交到我们的新集群。
机械设置
在 Ansys Mechanical 中,您可以像往常一样在本地计算机上设置作业。但是,当需要提交求解时,需要进行调整以指示 Mechanical 使用 RSM。要进行配置,请打开 Mechanical 界面并导航到 File → Solve Process Settings。将出现一个窗口,类似于如下所示的窗口。默认情况下,将选择“我的电脑”选项。要启用 RSM,请将此设置切换到 My Computer (我的电脑)、Background (背景)。
在此处,您可以配置 RSM 设置。将 Solution Execution Target 设置为 RSM,这将指定作业的提交位置。接下来,为任务选择适当的队列。虽然默认值为 “local”,但如果有多个选项可用,您可以选择其他队列。由于 RSM 配置工具已在前面的步骤中设置,因此 HPC 配置、HPC 类型和 HPC 队列的字段将根据保存的配置自动填充。
最后,提供作业名称(默认为 “Mechanical”),然后选择用于求解的许可证。设置好所有内容后,单击 OK(确定),指定要用于求解的 CPU 数量,然后继续求解模型!
Fluent 设置
在 Fluent 中提交作业需要的工作流程略有不同。如果您使用的是 Workbench Fluent,则可以使用以下过程。对于独立的 Fluent,可以从启动器中指定选项。
Access 解决方案属性:
- 在 Workbench 中,右键单击 Solution 单元格,然后选择 Properties 。
配置 RSM 提交设置:
- 在 Solution Process settings (求解进程设置) 下,将 Update Option (更新选项) 设置为 Submit to Remote Solve Manager (RSM) (提交到 Remote Solve Manager (RSM))。
选择 RSM 队列:
- 为您的作业选择合适的 RSM 队列。
设置执行模式:
- 根据您的要求将 Execution Mode 配置为 Serial 或 Parallel。
指定并行进程(如果适用):
- 对于并行解决方案,请设置 Number of Processes (进程数)。
- 确保进程数等于或小于集群中的可用内核数,并且每个进程至少处理 100,000 个节点或元素。
提交作业:
- 更新项目以将作业提交到 RSM。
- 在求解过程中,Solution 单元将移至 Pending 模式,并在运行完成后自动重新连接。
管理更新过程:
- 您可以随时通过右键单击 Solution 单元格来中断或中止更新。
- 此选项可用于前台、后台和 RSM 更新。