初衷:

是的,前段时间我特意做了一些测试,在 LoongArch 3A6000 的台式机上尽量使用最新的操作系统及其组建运行的,很多自媒体或者游戏玩家一般来说不会使用这样的测试,一方面是因为ta们的受众群体更喜欢简单的测试;另一方面大家都喜欢讲好听的故事。

今天我想来聊一聊龙芯 3A6000 与 2009 年4月发布的 AMD Phenom II X4 955 与两年前发布的 Steam Deck 掌机处理器 AMD Custom APU 0405 的性能对比。

完整的对比,大家可以访问这里

我们超越了15年前的 AMD

这里值得开心的是,目前的龙芯 3A6000 几乎在所有的处理器性能对比中能够“完胜”15年前的翼龙处理器,甚至在翼龙处理器有指令集加成的测试中,都获得了领先。不过仍然有3个测试,龙芯是落后与这颗老将的。

第一个是 CacheBench ,这个测试评估内存和缓存带宽性能,旨在评估系统的内存和缓存带宽性能。这对于了解系统在处理大量数据时的效率非常重要,特别是在需要频繁访问内存的应用场景中。

CacheBench 有三轮测试,分别是读取、写入、修改,龙芯输在了写入的测试这一项。

不晓得为什么龙芯 3A5000 新世界的成绩能够超越翼龙,这个就有点小神奇了。

下一个是用于破解无线网络的工具 Aircrack-ng 的对比:

这里需要大家注意,图片下方提到编译时使用的编译选项,针对于多平台测试对比非常重要,因为编译时只有统一选项才能保持公平公正,毕竟 Aircrack-ng 是可以利用 x86 架构的 avx,avx512 等指令集加快破解。

在公平公正通用选项编译的条件下,Aircrack-ng 测试能够很好地扩展到多个 CPU 核心上,这意味着它可以有效利用多核处理器的并行计算能力。同时,正因为 Aircrack-ng 可以利用多线程技术来加速计算,处理器的线程管理能力也是一个重要的性能指标,良好的线程管理可以确保每个核心和线程都能高效工作,从而提高整体性能。另外,处理加密算法时也需要大量的浮点运算,处理器的浮点运算性能也是一个关键指标,高效的浮点运算能力可以显著提高测试的运行速度。

最后是 WavPack Audio 编码:

音频编码针对处理器编码而言其实和上面提到的价值一样,单线程性能、多线程平行加速、指令集优化等等,在没有这些加成的条件下,目前龙芯 3A6000 距离翼龙还是有点差距,不过相对于 3A5000 好不少。

下面我们来看看龙芯 3A6000 和 Steam Deck 第一代( LCD 屏幕)的对比

下面是 LZ4 压缩和解压的速度对比,都是在没有编译器优化的条件下进行的。

无论是压缩和解压的速度相对于 3A5000 都有提升,但是相对于 Steam Deck 掌机而言,还是有些差距的。

下面我们看看 Zstd 的对比:

解压的情况来说,3A6000 的表现相对于 3A5000 好很多,距离 Steam Deck 也比较接近了。

看看 CoreMark 的测试:

这个结果总的来说还是不错的,相对于 3A5000 好很多,提升不是一点点,而且直接超越了飞腾D2000,距离 Steam Deck 也不远了。

再来看看大家比较关心的 C-ray 测试,这个测试使用处理器渲染图片,有点类似于 Windows 平台的 Cinebench ,当然,它们不能划等号,Cinebench 基于实际的 3D 渲染任务,而 C-Ray 则是一个专门的光线追踪计算任务;Cinebench 更适合用于评估处理器在图形渲染和多媒体处理中的表现,而 C-Ray 更侧重于纯计算性能,特别是浮点运算。

不过,两者都用于评估处理器的性能,特别是在多线程和浮点运算方面。

龙芯 3A6000 的性能叫 3A5000 提升了好几个数量级,也比 Steam Deck 好一点。

下面大家看到的是龙芯 3A6000 超越 Steam Deck 的几项测试,分别是流体动力学的基准测试、离散傅里叶变换、Connect-4 游戏等都取得比较好的成绩。

上图是流体动力学的基准测试结果对比,微弱优势胜出。

这是离散傅里叶变换的对比,龙芯具有绝对优势。

上图是Connect-4 游戏中龙芯 3A6000 的性能表现。

小结:

是的,我们的龙芯处理器性能确实有了明显的提升,不过大家看了完整的测试表后,我们距离世界领先水平还是有差距的,不要傲娇,我们的才刚刚开始。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注