NVIDIAGeForceRTX4070将是下一代高端游戏显卡,提供基于AdaLovelaceGPU的最新图形架构。该显卡将取代RTX3070,这是一款在500至600美元之间非常流行的游戏显卡。
不可否认,人们对提供最佳游戏性能的高端GeForceRTX4090和GeForceRTX4080系列显卡的热情很高,但RTX4070系列显卡将围绕500美元的美国细分市场进行设计,这是一个很高的价格-仍然提供大量性能的最终价格范围。很简单,RTX4090系列的目标用户是想要最好的,而不用担心他们花多少钱,而RTX4080系列的目标用户是希望以最优惠的价格获得最佳游戏性能的用户。RTX4070将成为高端游戏的最佳选择,提供流畅的2K游戏体验。
之前的GeForceRTX3070被吹捧为比RTX2070提供了巨大的改进,据说提供的性能比RTX2080Ti更快,但最终与Turing旗舰产品基本持平,只有RTX3070Ti的性能超过了之前的性能图灵GPU旗舰。看起来RTX4070将被放置在类似的位置,它可能提供与RTX3080Ti相当或接近的图形性能,但一个“Ti”变体在图形性能方面更进一步。
我们也应该期待下一代游戏解决方案也会出现类似的情况,但需要考虑的一个重要因素是GPU变得越来越耗电且价格越来越高。随着我们获得更好的产品,这种趋势可能会持续到未来,但作为回报,最终消费者总是要付出代价。因此,从我们目前所知道的开始,首先我们应该看看全新的AdaLovelace或AD10*级GPU,它们将为下一代GeForceRTX40系列显卡提供动力。
从GPU配置开始,据说NVIDIAGeForceRTX4070系列显卡使用了AD104GPU内核。据说GPU的尺寸约为300平方毫米,将采用台积电4N工艺节点,这是台积电为绿色团队设计的5nm(N5)节点的优化版本。
NVIDIAAdaLovelaceAD104GPU预计将配备多达5个GPC(图形处理集群)。这是比GA104GPU少一个GPC。每个GPU将由6个TPC和2个SM组成,与现有芯片的配置相同。每个SM(流式多处理器)将容纳四个子内核,这也与GA102GPU相同。改变的是FP32和INT32核心配置。每个子核将包括128个FP32单元,但组合的FP32+INT32单元将达到192个。这是因为FP32单元与IN32单元不共享相同的子核。128个FP32内核与64个INT32内核是分开的。
所以总的来说,每个子核心将由32个FP32加上16个INT32单元组成,总共48个单元。每个SM将总共有128个FP32单元加上64个INT32单元,总共192个单元。由于总共有60个SM单元(每个GPC12个),我们正在寻找7,680个FP32单元和3,840个INT32单元,总共11,520个内核。每个SM还将包括两个WrapSchedules(32线程/CLK),每个SM有64个wrap。与GA102GPU相比,核心(FP32+INT32)增加了50%,Wraps/Threads增加了33%。
转到缓存,这是NVIDIA对现有AmpereGPU的另一个重大推动。AdaLovelaceGPU将为每个SM打包192KB的L1缓存,比Ampere增加50%。在顶级AD104GPU上总共有2MB的L1缓存。如泄漏中所述,L2缓存将增加到48MB。这比仅托管4MB二级缓存的AmpereGA104GPU增加了12倍。缓存将在GPU之间共享。
最后,每个GPC的ROP也增加到32个,比Ampere增加了2倍。您正在查看多达160个ROP,而GA104AmpereGPU上只有96个。AdaLovelaceGPU上还将注入最新的第4代Tensor和第3代RT(光线跟踪)内核,这将有助于将DLSS和光线跟踪性能提升到一个新的水平。总体而言,AdaLovelaceAD103GPU将提供:
请注意,据说在2-3GHz范围之间的时钟速度没有被考虑在内,因此它们也将在提高每核性能(相对于安培)方面发挥重要作用。
正如我们在GA104GPU中看到的那样,NVIDIA可以为其GeForceRTX4070系列产品线提供各种配置的AD104GPU。我们实际上预计会有两种变体,RTX4070和RTX4070Ti。前者将成为初始阵容的一部分,而后者将作为中期更新推出。与全芯片相比,最入门级的GeForceRTX30的内核数量减少了23%,但这一次,“80级”显卡将由自己的芯片驱动,而不是依赖旗舰使用的AD102GPU.因此,我们可以期待从6144到完整的7680核心配置。
NVIDIAGeForceRTX4070将是一种精简配置,其核心数量略高于RTX3070TI(6144个核心),为未来的全脂配置“Ti”变体留出了一些空间。GPU将配备48MB的二级缓存和高达160的ROP,这简直太疯狂了。
时钟速度尚未确定,但考虑到正在使用TSMC4N工艺,我们预计时钟在2.0-3.0GHz范围内。高于通常的时钟速度提升来自于NVIDIA正在实现两个节点的跳跃,考虑到三星8nm节点的AmpereGPU实际上是一个经过一些优化的10nm工艺节点。NVIDIA正在跳过7nm并直接采用5nm节点,甚至不是香草变体,而是它的优化版本。借助台积电16nm节点上的Pascal,NVIDIA实现了巨大的频率飞跃,我们可以期待这次也有类似的飞跃。
至于内存规格,预计GeForceRTX4070将拥有12GBGDDR6容量,这可能会在192位总线接口上以更快的18Gbps速度提供。这将提供高达432GB/s的带宽。现在,所有这些提升的规格也将导致更高的功耗,旗舰预计将在300W左右的TBP下运行。现在对于300W,单个16针第5代连接器对于参考型号和定制型号都应该足够了。
NVIDIAGeForceRTX4070显卡规格、性能、价格和可用性——到目前为止我们所知道的一切3
至于其功能集,NVIDIAGeForceRTX4070显卡将震撼所有现代NV功能集,例如最新的第4代张量核心、第3代RT核心以及最新的NVENC编码器和NVCDEC解码器,并支持最新的蜜蜂。它们还将包含所有现代RTX功能,例如DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay和G-SYNC支持。