英伟达的Ampere A100成为有记录以来最快的GPU速度比Turing快43％

2021-08-11 08:37:00

导读在我们等待基于Ampere GPU架构的消费类显卡发布时，NVIDIA的旗舰级Ampere芯片A100继续刷新世界纪录。全球最大的基于7nm工艺节点的图形芯片

在我们等待基于Ampere GPU架构的消费类显卡发布时，NVIDIA的旗舰级Ampere芯片A100继续刷新世界纪录。全球最大的基于7nm工艺节点的图形芯片于5月发布，在规格和性能方面有大量支持。现在，Ampere A100张量核心加速器已成为OctaBench上记录的最快的GPU。

NVIDIA Ampere A100 HPC Tensor Core GPU成为Octa Bench记录以来最快的GPU，在关闭RTX的情况下，性能比Turing高43%

OTOY的首席执行官Jules Urbach分享了这一壮举。OTOY是Octa Bench的开发人员，Octa Bench是一个基准工具，使用户可以使用Octane Renderer评估GPU性能。OctaneRenderer本身是一个GPU渲染引擎，支持NVIDIA的RTX光线跟踪硬件加速，以提供清晰的渲染场景。

根据Jules的说法，NVIDIA A100 Tensor Core GPU在OctaBench中的得分为446。他还指出，即使关闭了RTX，该分数也比OctaneRender中的Turing GPU平均快43%。此处比较的Turing结果利用了RTX，不像游戏会导致帧速率大幅下降，在OctaRenderer中启用RTX可以带来更好的性能，因为可以使用可用的光线跟踪硬件更快地渲染和完成场景。

并未说明使用了哪个确切的Turing GPU与NVIDIA Ampere A100 GPU进行比较，但查看所有测试卡的完整平均工作台，我们看到了一系列有趣的结果。平均而言，A100的前身Tesla V100慢20%左右，但出于某种奇怪的原因，Titan V只慢11%，考虑到Titan RTX比A100 GPU慢38%，这令人惊讶。

对此的主要答案可能是，Titan V利用与Tesla V100相同的GV100 GPU，可以针对该数据中心和云规模基准进行更优化，而Turing GPU针对游戏和GP-GPU使用进行更优化。但是，该公司首席执行官再次指出，这是有史以来在特定工作负载上记录的最快的GPU，这对于NVIDIA A100 GPU加速器是一项巨大的壮举。

NVIDIA A100是迄今为止生产的最大的7nm芯片，其特征是在单个晶粒中封装了540亿个巨大的晶体管。由于收益率过高，A100的配置大大降低，但是像Tesla V100一样，一旦收益率提高，我们可能会看到具有更多内核的更高bin版本，这将进一步提高该特定基准测试的性能。