AMD Ryzen 9 3900X 处理器详细测试

2021-08-09 21:52:40

导读 AMD 向 Intel 投下 7nm 震撼弹 !! 全新 Zen 2 微架构、第 3 代 Ryzen 处理器正式登场，相较上代性能平均提升 15%、Cache

AMD 向 Intel 投下 7nm 震撼弹 !! 全新 Zen 2 微架构、第 3 代 Ryzen 处理器正式登场，相较上代性能平均提升 15%、Cache 容量倍增，率先支援 PCIe 4.0 传输技术，优化 DDR4 记忆体控制器，加上 7nm 制程改进令时脉进一步提升，整体性能增长最高可达 21%。HKEPC 编辑部找来全新 AMD Ryzen 9 3900X 处理器，与同价位对手 Intel Core i9-9900K 作效能对比测试。

全新 7nm 制程、第 3 代 Ryzen 处理器登场

AMD 正式向 Intel 投下 7nm 核弹，推出全新 Zen 2 微架构、第 3 代 Ryzen 处理器，受惠于微架构改良 IPC 性能相较上代「Zen+」平均提升约 15%，加上全新 7nm 制程改进令核心时脉再提升 350MHz，令整体性能提升可达 21%。

更重要的是，全新 7nm 制程让 AMD 可以在现有的 Socket AM4 封装放进更多处理核心，以性价比及多核优势作卖点，相同 CPU 核心数规格售价较 Intel 便宜，相同价位下 CPU 核心更多、性能更高，相信有不少用家会转投 AMD 怀抱，进一步打破 INTEL 市场垄断局面。

回顾 AMD 这三年的进步，无论是制程及微架构都按照时程表发展并準时实现，在 Socket AM4 平台实现 3 个微架构及制程改良、CPU 核心数目提升 4x、PCIe 频宽提升 1x，记忆体频宽提升了 33%，相较 Intel 仍保持老旧的 14nm 制程，让 AMD 声势变得一时无两。

全新 AMD Zen 2 微架构

▲ AMD Zen 2 微架构 Block Diagram

相较上代「Zen+」微架构属于半代更新，仅针对 Cache 及记忆体系统作出改动，全新「Zen 2」微架构有着更明显的改良，包括了增加内部频宽、提升运算单元使用率、提升缓存命中率、提升单一週期指令执行数等等，主要改进及全新设计包括︰

→ 改用 256bit Single-Op 浮点单元

→ μOps Cache容量倍增至 4096 byte

→ 全新的 TAGE 预测分支设计

→ 增至 3 组 AGU 单元

→ 增加 Load/Store Bandwidth

→ L3 Cache 容量提升 1 倍

→ 改良 Fetch 及 Pre-Fetch 能力

→ 改良 ALU 及 AGU Schedulers

→ 增加 Register File 容量

→ IMC 控制器改良、提升至 DDR4-3200+

经改良的 Front End 引擎

全新 AMD Zen 2 微架构针对 Front End 引擎作出了不少改良，具备全新 TAGE Branch Predictor 单元设计，透过优化内部演算法去预测将被执行的指令，并寻找下个直接及间接目标，提早填充至 Request Queue 单元，有助降低运算延迟并优化记忆体系统并行性能。

AMD 扩大了 Zen 2 微架构的 Branch Target Buffer (BTB) 缓存，L1 BTB 由 256 增至 512 entries、L2 BTB 由 4096 增至 7,168 entries、ITA 增至 1024 entries，相较上代 Zen+ 有效降低约 30% 预测分支失败率。

▲ AMD Zen 2 微架构的指令提取设计

此外， AMD Zen 2 微架构为提升 Micro-Tags 效率，将 μOps Cache 缓存的可储存指令量由上代 2,048 增加一倍 4,096 条，让更多解码后的 μOps 指令可被暂存，当遇上相同的 x86 指令时不需要再 Decoder 单元进行解码，直接由 μOps Cache 缓存单元提取 μOps 指令，为 Front-End 引擎提供更高的 x86 指令吞吐量。

▲ AMD Zen 2 的 Front End 引擎

指令解码方面， AMD Zen 2 微架构的 Front-End 引擎沿用 1 组 4-Wide x86 Decoder ，每个週期可处理 4 个 x86 指令，但进一步改良了 Fast Path 设计，Decoder 单元支援更多 x86 操作指令可被融合成 1 个 μOps 指令，令运算效率进一步提升。

此外，AMD Zen 2 微架构亦将 μOps Cache 每个週期可提取的 μOps指令数目由 4 条增至 8 条，更多的 μOps 指令会被传送至 μOps Queue 列队单元等待分配，进一步提升处理器的 x86 指令吞吐量，更有利于 SMT 同步多线程运算效率。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：