戴尔DELL Precision 7865 塔式工作站评测—性能测试篇

作者:admin 来源:成都戴尔工作站总代理 点击量:--

是时候深入了解 Dell Precision 7865 的性能了。我们进行了广泛的测试,并尽可能地强调系统的每个区域。当然,64 核 Threadripper Pro CPU 让人特别感兴趣,但我们也对 RTX A6000 和其他组件进行了测试……

ATTO磁盘基准

ATTO磁盘基准 测试是一项快速而简单的测试,可测量一系列不同数据大小的读/写带宽和 IOPS。虽然我们通常不会在多台机器上比较这些结果,但衡量特定系统的存储子系统是否可以承受压力是很有用的。

我们系统中的 RAID 0 配置可实现快如闪电的存储性能。顺序读取速度接近 12GB/s,而顺序写入速度超过 8GB/s。是的,由于容错性降低,任何 RAID 0 配置都存在一些风险,但这正是在任何情况下都应定期备份重要数据的原因。即使是 RAID 10 也可能在灾难性情况下崩溃,因此请确保您的数据安全。

Cinebench R23

基于 Maxon Cinema 4D 的 Cinebench 渲染性能测试。Cinema 4D 是一个 3D 渲染和动画工具套件,被索尼动画和许多其他动画公司和制作人使用。它对系统处理器资源的要求非常高,最多可以使用 256 个线程,这使其成为计算吞吐量的绝佳衡量标准。这是一个多线程、多处理器感知基准,可渲染 3D 场景并为其设置动画并跟踪整个过程的长度。每个测试系统能够渲染整个场景的速率如下图所示。

Threadripper Pro 5995WX 即使是最强大的台式机级处理器,如英特尔酷睿 i9-13900KS,在多线程任务中看起来也像儿戏。诚然,这些优势并没有延续到单线程结果中。虽然Zen 3内核的表现不错,但 AMD 和英特尔的最新迭代将单核数据推得更高。

LAME XP 音频编码

对于这个测试,我们创建了 16 个我们自己的 223MB WAV 文件的副本(一个 11 分钟的 Grateful Dead 即兴演奏),并使用支持多线程的 LAME XP 工具将其转换为 MP3 格式。处理时间记录在下面,以分钟:秒为单位列出。更短的时间等同于更好的性能。

4.jpg

再一次,Precision 7865 系统凭借其极快的 Threadripper CPU 取得了巨大的胜利。以快 25% 的速度完成音频转码似乎不是将价格降至近 15,000 美元的最佳理由,但对于某些规模经济而言,这种权衡可能意味着利润增加数千美元。

7-Zip 数据解压缩

7-Zip 基准测试使用 LZMA 方法测量解压缩性能,该方法利用 Lempel–Ziv–Markov 链算法执行无损数据压缩。该基准测试以 GIPS(每秒千兆指令)为单位给出最终评级。

该图看起来与 Cinebench 的结果惊人地相似,加强了两者的结果。层次结构有些混乱,但当所有线程都被占用时,没有其他芯片可以与 64 核 Threadripper Pro 5995WX 的愤怒相提并论。

POV-Ray CPU 光线追踪基准测试

POV-Ray,或视觉射线跟踪器的持久性,是一种用于创建逼真照明图像的开源工具。我们使用 POV-Ray 的标准“单 CPU”和“全 CPU”基准测试工具在我们所有的测试机器上进行了测试,并记录了每台机器的分数。结果以每秒像素吞吐量衡量;更高的分数等同于更好的表现。

回到或多或少的纯计算工作负载,Precision 7865 再次登上领奖台,但这里有一个闯入者 Lenovo ThinkStation P620。自从我们审查该系统以来,我们的基准发生了重大变化,但这是一个适用于直接比较的结果。它们都使用 64 核处理器,因此显示 3995WX 和 5995WX 之间的世代收益在多线程中达到约 14%,在单线程中达到约 22%。

Y-Cruncher 多线程 Pi 基准测试

Y-Cruncher 是一种支持多核的工具,可以将 pi 的值计算到指定的位数。在这种情况下,我们在所有线程上运行该工具并让应用程序计算 pi 的值到 10 亿位。下面的值是以秒表示的执行计算所需的时间。因此,较低的值表示更好的性能。

我们可以为任何实际应用需要 Pi 的多少位数争论不休,但 Precision 7865 可以在我输入这句话之前计算出超过 10 亿个 Pi。它以微弱优势领先于其他工作站芯片,但这些芯片与台式机芯片之间的有趣差异表明内存带宽限制也可能在起作用。

UL 3DMark CPU 物理基准测试

对于 3DMark 物理测试,我们只需创建一个仅由物理测试组成的自定义3DMark运行,它是多线程和 CPU 依赖的,并报告结果。

该测试表明,纯粹的 CPU 实力并不总能转化为顶级性能。面向游戏的 CPU 拥有更高的时钟,并且该测试支持响应速度超过核心可扩展性,至少超过了某个点。

BlackMagic RAW 视频编码速度

Blackmagic RAW Speed Test 是一款 CPU 和 GPU 基准测试工具,用于测试全分辨率 Blackmagic RAW 视频解码性能。该工具可用于评估 CPU 在各种分辨率和比特率下的性能,或在 GPU 上使用 OpenCL。我们在这里报告两个结果,都使用 8K 分辨率,但比特率和压缩级别不同。

从 CPU 结果开始,Dell Precision 7865 在两个压缩级别上都稳居榜首,尽管没有我们在其他测试中看到的那么大的差距。CPU 引擎跨内核的可扩展性可能存在一些限制,这阻碍了更好的结果。不要误会我们的意思,这是一个很好的结果,但不是最好的价值主张。

继续使用相同基准测试的 GPU 结果,我们首次体验了内部的 NVIDIA RTX A6000。在按更压缩的 12:1 结果排序时,Precision 7865 落在了我们的中间位置,客观上与扩展 GPU 马力一致。

然而,随着 3:1 的结果,一些奇怪的事情发生了。Precision 7865 的性能是其他竞争产品的两倍,甚至超过了 12:1 的帧率。这是几个因素的组合。RTX A6000 有一个巨大的 48GB 帧缓冲区,系统内存可以利用 8 通道带宽,当你有足够的内存容量和带宽来处理视频时,压缩较少的视频实际上在计算上的负担更小。通过缓解与内存相关的瓶颈,这个工作站绝对可以碾压这个用例。

VFX 艺术家尤其要注意,因为压缩较少的镜头意味着可以更清晰地应用色度键,并且整体视觉效果最终会变得更好看。

Blender 渲染基准

Blender 是一个免费的开源 3D 创作套件,可以处理从建模、绑定和动画到模拟、渲染、合成和运动跟踪的所有内容。它有一个专门构建的基准测试工具,可以跟踪完成渲染特定模型(或多个模型)所需的时间。我们对基准工具中当前可用的所有三种模型都使用了以 CPU 和 GPU 为重点的基准。

再次从 CPU 测试开始,Precision 7865 击败了我们迄今为止测试过的所有其他系统。对于纯 CPU 计算,Threadripper Pro 5995WX 无法合理匹配。CPU 渲染并不是全部,尽管……

在使用 GPU 的情况下,戴尔系统再次发现自己处于我们的采样中间。RTX A6000 的绝对马力不及RTX 3090 Ti,更不用说桌面上的Ada Lovelace选项了。我们真的很犹豫地说 RTX A6000 一点也不强大,但这仅取决于您的工作流程优先级所在。

PCMark 10

接下来我们将使用 PCMark 进行一些完整的系统测试。我们报告了 PCMark 10 基准测试套件的所有测试结果,包括 Essentials、Productivity、Digital Content Creation 和 PCMark 总分。Essentials 测试涵盖网络浏览、视频会议和应用程序启动时间等工作负载,而 Productivity 测试从电子表格到文字处理的日常办公应用程序。最后,数字内容创建测试评估机器在照片和视频编辑以及渲染和可视化方面的性能。

说实话,PCMark 并不是测试 Dell Precision 7865 等笨重工作站的最佳途径。它的大部分任务都支持高频内核的突发性能,而应用程序无法扩展以有效使用 128 线程。Digital Content Creation 分项分数是其中最适用的,但即便如此,它仍不及引入工作站的工作负载类型。顺便说一句,联想 ThinkStation 系统在 Essentials 测试之外的表现更差。

SPECviewperf 2020 v3 OpenGL / DX 基准测试

SPECviewperf 包括各种测试,它们会产生明显不同的帧速率,因此我们将它们分为三组,以便更容易对结果进行分类。请注意每个图表底部的图例,这些图例指定了所使用的应用程序或视图集...

NVIDIA RTX A6000 在我们在 SPECviewperf 的 GPU 计算测试中运行的其他专业卡上遥遥领先。无论您的工作负载包括使用 Maya 或 3D Studio Max 进行 3D 建模、使用 Solidworks 进行工程设计,还是这里介绍的其他要求苛刻的案例之一,Dell Precision 7865 都能胜任这项任务。

热门文章