Lumerical FDTD 工作站/集群/云架构硬件配置规格

时间:2022-04-29   来源:   网友评论:0   人气: 24 作者:

在本文中,我们打算为希望购买新硬件的用户提供一些一般提示和指南,或者只是想了解某些计算机硬件组件如何影响单个工作站上 FDTD 模拟的速度

内存大小 (RAM)

内存大小决定了可以在计算机上运行的仿真设计或项目的大小。只要整个模拟可以放入RAM,它就不会影响模拟速度,否则计算机可能会被迫将内存交换到硬盘驱动器(或应用程序将提供错误)。如果发生交换,模拟速度将非常慢。

现在的台式计算机通常具有 8-32 GB 的 RAM,足以运行大部分模拟。工作站通常有 32-128 GB 的 RAM,足以运行几乎所有的模拟。您可以检查从 FDTD 运行模拟需要多少内存。

内存带宽 (RAM)

在 FDTD 仿真过程中,必须在 RAM 和 CPU 之间连续传输大量数据。当内存总线无法足够快地传输数据时,处理器将被迫等待,从而限制了模拟的整体速度。例如,在具有 8 核的典型台式计算机上,与使用 1 核相比,使用 8 核时模拟速度可能会提高 2-3 倍。因此,在购买电脑时,拥有快速的内存带宽非常重要。

CPU 核心数

FDTD Solutions 将尝试并使用您所有的 CPU 内核以尽可能快地运行。但是,正如我们在上面了解到的,FDTD 模拟受内存带宽限制,因此添加更多内核并不总是会使模拟运行得更快。大多数用户在迁移到更高核心数的 CPU 时看到的加速通常是由于 CPU 架构的其他(与内存相关的)改进。

大多数 CPU 支持超线程,这允许操作系统将每个物理 CPU 内核视为两个逻辑内核。此功能不会为 FDTD 仿真提供任何速度提升,因为整体性能瓶颈是 CPU 和 RAM 之间的数据传输速率,而不是内核的实际计算能力。

CPU时钟速度

CPU 时钟速度通常不是 FDTD 仿真速度的最重要因素。虽然更快的时钟速度确实可以让每个内核运行得更快,但整体仿真速度受限于 CPU 和 RAM 之间的访问。

具有多个 CPU 的工作站

具有多个 CPU 的工作站是提高模拟速度的好方法。最重要的因素是每个 CPU 都有自己的内存总线连接到 RAM。如上所述,CPU 和 RAM 之间的数据传输率是性能瓶颈,因此每个 CPU 拥有一条内存总线可以使模拟速度与 CPU 的数量非常吻合。

例子:

有 Intel Xeon Gold 5115 一个 ' Maximum memory bandwidth' 107 GB/s。在单个工作站中最多可以安装 4 个这样的处理器,这将提供 4 x 107 = 430 GB/s 的总带宽。为达到最佳性能,应使用 DDR4-2400 内存模块。

参考:
- 英特尔至强金牌处理器 65
- 至强金牌 5115 处理器规格 63
- 英特尔至强处理器 - 价值分析 65

集群(网络上的多台计算机)

在单台计算机不够用的应用中,可以通过网络将多台计算机连接起来,形成一个“集群”。FDTD Solutions 在集群上运行时支持 2 种模式: 跨网络运行多个模拟 (即扫描或优化)和 跨多台计算机运行单个大型模拟

网络速度和延迟

  • 在单台计算机上本地运行模拟时,网络速度对模拟速度没有任何影响。
  • 在单台计算机上远程运行模拟,或 在集群上运行多个模拟 (即扫描或优化)时,网络延迟对模拟速度没有影响,网络速度只会影响检索结果的速度。
  • 在 多台计算机上运行单个大型仿真时,网络速度非常重要—— 在这种情况下建议使用高速、低延迟的互连,例如 InfiniBand 。

云计算

您可以在做出购买决定之前使用云计算服务来评估最新的硬件,或者在长期硬件投资没有意义的情况下:

文章评论