NVIDIA GeForce GTX 680绘图卡

导读 NVIDIA 推出全新「 Kepler 」 GPU 微架构、採用 28nm 制程由 TSMC 代工的「 GK104 」绘图核心作出反撃。首款型号将为「 GeFo


NVIDIA 推出全新「 Kepler 」 GPU 微架构、採用 28nm 制程由 TSMC 代工的「 GK104 」绘图核心作出反撃。首款型号将为「 GeForce GTX 680 」,全新 SMX"s CUDA Core 数目高达 1536 个,并加入大量 Fixed Function 的 Hardware Block 以提升 Rasterization 、 Shading 、 Texturing 及 GPU Compute 效率,配合全新 GPU Boost 技术针对 TDP 与功耗作出动态超频,究竟全新「 GeForce GTX 680 」能否力压「 Radeon HD 7970 」,成为新一代高阶绘图卡霸主 !?



NVIDIA GPU Evolution

G80

GPU 发展由 Fixed Fuction 、 Simple Shaders 发展至今日 Graphics Parallel Core

GPU 设计在进入 Direct X10 时代出现重大变化,由以往採用 Fixed Fuction 、 Simple Shaders 进化至 Graphics Parallel Core 设计,同时 GPU 亦不再局限于 3D 游戏及绘图应用,并朝向 GPGPU 通用运算发展, GPU 的用途变得更广泛,这一年 ATI ( 及后被 AMD 併购 ) 与 NVIDIA 均朝向 Unified Shader 方向发展,但微架构理念却各不相同。

ATI 决定选择 VLIW 架构 (Very Long Instruction Word) 的 SIMD 架构,每组 Stream Processor Unit 内建 5 个 ALU 运算单元,称为「 VLIW5 」微架构,这 5 个 ALU 单元并非全功能,其中 4 个 ALU 单一週期可运算 4 个 32Bit FP MAD 、 2 个 64Bit FP MUL / ADD 、 1 个 64Bit FP MAD 或是 4 个 24Bit Int MUL / ADD 指令,却不能执行 Special Function 或 Transcendentals 指令,余下的一个是专门化 ALU ,单一週期可处理一组 Special Function 或 Transcendentals 指令,或是 1 组 32Bit FP MAD 指令。

採用「 VLIW5 」架构好处是 5 组 ALU 运算单元能共享一组 Branch Execution Unit 、 Registers 等单元,节省电晶体使用数,减低成本、晶片功耗及提升未来扩展性。同时, ATI 希望新架构在支援 DirectX 10 规格之余,亦能提共优势的 DirectX 9 的游戏性能,「 VLIW5 」架构正好能满足 DirectX 9 需要计算像素位置参数 (XYZW) 及颜色参数 (RGB) ,需要同时处理 4 笔资料的要求。

NVIDIA GeForce GTX680
NVIDIA PC GPU 事业群总经理 Drew Henry 分析 NVIDIA 全新 GPU 微架构的理念

NVIDIA 选择了与 ATI 完全相异的 1D Scalar 的 MIMD 多指令多数据设计,每个 Stream Processor 仅内建 1 组全功能的 ALU ,并拥有独立的 Branch Execution Unit 、 Registers 等,虽然 Stream Processor 所需电晶体相较对手多, ALU 数目亦较对手为低,在最高运算理论值上不及对手,简单直接的 GPU 架构令内部单元运用效率高,不仅在 3D 性能上长期压倒对手,同时亦有利于 GPGPU 领域发展。

为了解决此一缺点, AMD 推出了全新的「 GCN 」架构,在 SIMD 设计中加入了 MIMD 的元素,大幅提升了内部单元运用效率,令 Radeon HD 7000 系列性能大幅提升。 NVIDIA 虽然在效率上相较对手优胜, CUDA 当运算单元数目不断增加, 1D Scalar 的 MIMD 设计相较对手的 SIMD 架构佔用更多的电晶体,为了减少 Die Size 及提升功耗性能比, NVIIDA 的 GPU 设计由单纯的 MIMD 设计加入了 SIMD 单元,进入 Direct X 11 时代,两者 GPU 微架构设计方向开始变得相近。

免责声明:本文由用户上传,如有侵权请联系删除!