在本文中,我们打算为希望购买新硬件的用户提供一些一般提示和指南,或者只是想了解某些计算机硬件组件如何影响单个工作站上 FDTD 模拟的速度
内存大小 (RAM)
内存大小决定了可以在计算机上运行的仿真设计或项目的大小。只要整个模拟可以放入RAM,它就不会影响模拟速度,否则计算机可能会被迫将内存交换到硬盘驱动器(或应用程序将提供错误)。如果发生交换,模拟速度将非常慢。
现在的台式计算机通常具有 8-32 GB 的 RAM,足以运行大部分模拟。工作站通常有 32-128 GB 的 RAM,足以运行几乎所有的模拟。您可以检查从 FDTD 运行模拟需要多少内存。
内存带宽 (RAM)
在 FDTD 仿真过程中,必须在 RAM 和 CPU 之间连续传输大量数据。当内存总线无法足够快地传输数据时,处理器将被迫等待,从而限制了模拟的整体速度。例如,在具有 8 核的典型台式计算机上,与使用 1 核相比,使用 8 核时模拟速度可能会提高 2-3 倍。因此,在购买电脑时,拥有快速的内存带宽非常重要。
CPU 核心数
FDTD Solutions 将尝试并使用您所有的 CPU 内核以尽可能快地运行。但是,正如我们在上面了解到的,FDTD 模拟受内存带宽限制,因此添加更多内核并不总是会使模拟运行得更快。大多数用户在迁移到更高核心数的 CPU 时看到的加速通常是由于 CPU 架构的其他(与内存相关的)改进。
大多数 CPU 支持超线程,这允许操作系统将每个物理 CPU 内核视为两个逻辑内核。此功能不会为 FDTD 仿真提供任何速度提升,因为整体性能瓶颈是 CPU 和 RAM 之间的数据传输速率,而不是内核的实际计算能力。
CPU时钟速度
CPU 时钟速度通常不是 FDTD 仿真速度的最重要因素。虽然更快的时钟速度确实可以让每个内核运行得更快,但整体仿真速度受限于 CPU 和 RAM 之间的访问。
具有多个 CPU 的工作站
具有多个 CPU 的工作站是提高模拟速度的好方法。最重要的因素是每个 CPU 都有自己的内存总线连接到 RAM。如上所述,CPU 和 RAM 之间的数据传输率是性能瓶颈,因此每个 CPU 拥有一条内存总线可以使模拟速度与 CPU 的数量非常吻合。
例子:
有
Intel Xeon Gold 5115
一个 'Maximum memory bandwidth
' 107 GB/s。在单个工作站中最多可以安装 4 个这样的处理器,这将提供 4 x 107 = 430 GB/s 的总带宽。为达到最佳性能,应使用 DDR4-2400 内存模块。参考:
- 英特尔至强金牌处理器 65
- 至强金牌 5115 处理器规格 63
- 英特尔至强处理器 - 价值分析 65
集群(网络上的多台计算机)
在单台计算机不够用的应用中,可以通过网络将多台计算机连接起来,形成一个“集群”。FDTD Solutions 在集群上运行时支持 2 种模式: 跨网络运行多个模拟 (即扫描或优化)和 跨多台计算机运行单个大型模拟。
网络速度和延迟
- 在单台计算机上本地运行模拟时,网络速度对模拟速度没有任何影响。
- 在单台计算机上远程运行模拟,或 在集群上运行多个模拟 (即扫描或优化)时,网络延迟对模拟速度没有影响,网络速度只会影响检索结果的速度。
- 在 多台计算机上运行单个大型仿真时,网络速度非常重要—— 在这种情况下建议使用高速、低延迟的互连,例如 InfiniBand 。
云计算
您可以在做出购买决定之前使用云计算服务来评估最新的硬件,或者在长期硬件投资没有意义的情况下:
- Amazon Web Services: 实例类型 “通用”和“计算优化”。 在 AWS 上运行 FDTD 解决方案。
- Microsoft Azure: 实例类型: “通用”、“计算优化”和“高性能计算”。 在 Microsoft Azure 上运行 FDTD 解决方案 。
- 更多...
文章评论