英伟达 GeForce RTX 3080 Ti 实机评测:比RTX 3090性价比还强上一筹
今年的中国台北电脑展上,英伟达正式推出了基于 NVIDIA Ampere 架构的 GeForce RTX 3080 Ti 显卡和 GeForce RTX 3070 Ti 显卡,这两款显卡公版产品国内售价分别为 8999 元和 4499 元。
天下苦挖矿久矣,今年随着虚拟货币市场的燥热,矿老板们都在疯狂采购各种显卡以及游戏本显卡,这就导致面向消费级显卡一卡难求,虽然英伟达也陆续推出了 RTX 3060 系列显卡,但是面对市场对显卡产品的巨大需求,显卡一上新立刻被抢购一空,矿老板赚的盆满钵满,消费者却没有显卡可买,最新的 RTX 30 系列显卡也成为大家口中的空气卡。
不过,英伟达似乎也意识到矿老板们对消费级市场的影响,也通过驱动层面,针对性的限制了新的 RTX 30 系列显卡算力,加上最近的虚拟货币市场的大崩盘,似乎让我们看到能买到新显卡的希望。
这次IT之家已经拿到英伟达全新的 GeForce RTX 3080 Ti 显卡,这次英伟达 GeForce RTX 3080 Ti 依旧采用了与 GeForce RTX 3080 一致的外观。虽然整体外形相比与 GeForce RTX 3090 小了一圈,但是这次英伟达在核心的设计上,RTX 3080 Ti 与 RTX 3090 相差不大,唯一差距比较大的就是显存,RTX 3080 Ti 配备了 12GB 的美光 GDDR6X 显存,而 RTX 3090 则是配备了 24GB 的 GDDR6X 显存。
这次 GeForce RTX 3080 Ti 核心采用基于 NVIDIA Ampere 架构的 GA102 核心,核心型号为 GA102-225,由于采用三星 8N 工艺,这次 GA102 单片面积相比于上一代 TU102 更小,单片面积为 628.4 平方毫米,但晶体管密度更高,总晶体管数量 283 亿个。
由于公版的 GeForce RTX 3080 Ti 显卡采用前后双风扇的设计,因此其 PCB 板也是采用了锯齿形的设计,整个 PCB 板上的各类元器件排布也是非常的紧密。围绕在 GA102-225 核心周围是 12 颗美光 GDDR6X 显存,单颗显存大小为 1GB。
一个完整的 GA102 核心总共包含 7 组 GPC 单元,每组 GPC 单元包含 12 组 SM 单元,NVIDIA Ampere SM 单元是 RTX30 系列显卡的核心构件,它由 CUDA 核、第三代 Tensor Core、第二代 RT Core、纹理单元、加载 / 存储单元、L0 和 L1 缓存、共享显存和寄存器等方面构成。
▲GA102 核心示意图
每个 SM 单元包含 4 个分区,每个分区包含第三代 Tensor Core,还包含由 16 个 FP32 单元、8 个 FP32+8 个 INT32 单元组成的混合单元,可执行 FP32 或 INT32 运算。完整的 GA102 核心总计 84 组 SM 单元。
此前发布的 GeForce RTX 3090 显卡至屏蔽了 2 组 SM 单元,基本上是一个完整的 GA102 核心了,而这次 GeForce RTX 3080 Ti 相比于 GeForce RTX 3090 仅仅阉割了 2 组 SM 单元,总计 80 组 SM 单元。如果抛去显存这个因素的来看的话,GeForce RTX 3080 Ti 在核心上和 GeForce RTX 3090 差距基本不大。
英伟达 GeForce RTX 3080 Ti 显卡总共包含 10240 个 CUDA 核、320 个第三代 Tensor Core、80 个第二代 RT Core。同时还拥有 320 个纹理单元和 96 个光栅处理单元。其基础频率为 1365MHz,加速频率为 1665MHz。
负责光追运算的 RT Core 在 NVIDIA Ampere 架构上得到更新,其最大的更新是增加了动态模糊的加速运算支持,英伟达表示第二代 RT Core 光追效率是上一代的 8 倍。负责 AI 计算的 Tensor Core 这次在 NVIDIA Ampere 架构中也升级到第三代,作为显卡的 AI 大脑,Tensor Core 通过加速深度神经网络处理数据,相比第二代 Tensor Core,第三代的 Tensor Core 能效更高。
更强的 AI 处理能力也让 DLSS 功能得到更大的进化,甚至可以触及 8K 这个现阶段显示行业的上限,DLSS 8K 这一功能通过深度学习将画面分辨率从 2K 提升到 8K,这里第三代 Tensor Core 功能上的进化功不可没。
基于 NVIDIA Ampere 架构的第三代 Tensor Core 还可以支持全新的 NVIDIA Broadcast 技术。
NVIDIA Broadcast 技术允许玩家在视频直播过程中进行 AI 实时声画处理,实现高质量、高帧率的流畅直播体验。通过这项技术可以实现 AI 智能降噪,虚拟背景和自动取景等功能。
这次 GeForce RTX 3080 Ti 配备了 12GB 的 GDDR6X 显存,显存位宽达到 384bit,显存频率达到 19Gbps。
相比于 GeForce RTX 2080 Ti 的 10GB 的 GDDR6 显存有了更大的提升。GDDR6X 舍弃了 GDDR6 采用的 NRZ 编码方式转而采用对电压控制更加精细的 PAM4 编码。
PAM4 编码方式可以通过四种不同的电平来代表 2 个 bit 的逻辑信息,分别是 00、01、10、11,而原先的 NRZ 编码方式则只能在单位时间内由高低电平表示 0、1 两个数据,因此 PAM4 编码的波特率仅为 NRZ 编码的一半,因此采用 GDDR6X 的 GeForce RTX 3080Ti 显存带宽可以达到 912GB/s。
另外,英伟达 GeForce RTX 30 系列显卡也对 AV1 编码格式以及 DP 1.4a、HDMI 2.1 接口进行了支持,HDMI 2.1 其传输能力更加强大,显卡可以输出 8K@60Hz 或者 4K@120Hz 视频内容。
英伟达在 GeForce 显卡中还引入了 NVIDIA Reflex 低延迟技术,这项技术通过 GeForce 显卡以及 G-Sync 共同作用实现竞技类游戏更低的系统延时,以此实现更快的目标获取,以此提升瞄准的准确性。目前,这项功能已经支持《APEX 英雄》、《堡垒之夜》、《使命召唤:黑色行动冷战》等游戏。
相比于 GeForce RTX 3090 显卡,此次全新的 GeForce RTX 3080 Ti 显卡在核心二者几乎一致,区别基本上就相差在整体的尺寸、NVIDIA SLI 技术支持以及显存容量大小上。虽然显存大小缩水了一些,但这并不影响在内容创作领域 GeForce RTX 3080 Ti 显卡的能力。
如果说对比上一代 GeForce RTX 2080 Ti,那么 GeForce RTX 3080 Ti 在整体性能上的提升确实是飞跃性的,并且官方 8999 元的公版起售价格相比于 GeForce RTX 2080 Ti 性价比更高,GeForce RTX 2080 Ti 当年上市的时候售价达到了 9999 元。
从整体硬件参数上对比,GeForce RTX 3080 Ti 显卡显然与 GeForce RTX 3090 十分接近,也就是说,在绝大部分主要依靠 GPU 核心计算的场景下,二者应该相差不大。如果从 GPU 核心角度来看,GeForce RTX 3080 Ti 显然性价比更高一些。
接下来,我们来看一下 GeForce RTX 3080 Ti 的更多外观细节。
外观
这一代 RTX 30 系列公版显卡相比于上一代煤气灶造型最大不同无疑就是风扇摆放的位置了,GeForce RTX 3080 Ti 显卡采用正反双风扇设计,背面有 RTX 3080 Ti 的标志。
GeForce RTX 3080 Ti 显卡正面有着大面积的散热鳍片,在金属框架下隐藏有几颗螺丝。
前后双风扇设计,可以在机箱内形成两个独立的风道,一路风道直接排出 GPU 核心热量,另一路风道则利用散热鳍片和散热管在显卡上方形成另外一个风道,以此传导显卡产生的废热。在运行过程中并没有明显的风噪,非常安静。
为了保证前后双风扇散热能在技术上实现,英伟达公版的显卡均是采用锯齿状的异形 PCB 板以此实现前后双风扇散热这项技术。
这次公版的 GeForce RTX 3080 Ti 显卡并没有采用主流的 8 Pin 电源线,这还是因为异形 PCB 板的原因,取而代之的是一个超小的 12 Pin 专有供电接口。
因为 PCB 板架构更加紧凑,所以电源接口的尺寸和体积不得不做出调整。好在英伟达官方有提供转接线,以此兼容主流电源。
作为一个公版显卡,GeForce RTX 3080 Ti 信仰灯自然必不可少,在侧面的 GeForce Logo 上,点亮电源即可亮起白色的灯光,侧边还有 2 颗螺丝,方便显卡架固定。
接口方面,GeForce RTX 3080 Ti 拥有 3 个 DP 1.4a 接口和 1 个 HDMI 2.1 接口。公版全家福包括显卡本体、说明书、保修证明和转接线。
接下来,我们通过实际场景测试来看一下英伟达全新的 GeForce RTX 3080 Ti 显卡的实际表看如何。
理论性能
首先,我们对英伟达 GeForce RTX 3080 Ti 进行理论测试,来看一下相较于 GeForce RTX 3080 和 GeForce RTX 3090 的理论性能表现。GPU-Z 最近刚好迎来一轮升级,也可以顺利识别 GeForce RTX 3080 Ti 的大部分参数信息。IT之家作为首发媒体,目前已经提前拿到了版本号是 466.54 的媒体驱动。
接下来,我们来看一下此次评测的硬件平台,平台信息如下:
这里,IT之家选择现阶段英特尔酷睿 i9-11900K 旗舰级处理器产品,以此保证在常见评测场景下处理器性能不拉垮。
由于英特尔酷睿 i9-11900K 引入了 ABT 睿频功能,这项功能允许酷睿 i9-11900K 在不超频的情况下稳定的运行在全核 5.0GHz 频率下。当然 ABT 睿频功能在实际使用中会产生大量热量,因此一个好的散热器去压酷睿 i9-11900K 非常重要。这次IT之家选择了酷冷至尊暴雪 T624 作为评测的散热器,这款散热器产品采用了双塔设计,标配 2 个 14 厘米漩涡风扇。
核心散热器件上,酷冷至尊暴雪 T624 散热器采用了 6 根 6 毫米镀镍热管,目前支持市面上主流的 AMD 接口和英特尔接口,因为暴雪 T624 固定只有 2 根长螺丝,所以别看它体积大,但实际安装起来非常方便。
底部纯铜镀镍底座可以快速传导来自酷睿 i9-11900K 和锐龙 R9-5900X 散发的大量热量。标配的 2 个 14 厘米风扇最大转速 1400RPM,风量达到 67CDM。
由于酷睿 i9-11900K 和 GeForce RTX 3080 Ti 显卡在使用过程中,功耗比较高。为了稳定的电力保障,IT之家这次使用了酷冷至尊 GX1050 GOLD 全模组电源为整个测试平台供电。这一电源额定功率为 1050W,属于 18 厘米长度的 ATX 结构电源,采用全模组接口设计,并通过 80 Plus 金牌认证。其中 140 毫米的风扇支持温控调速和智能启停技术。
酷冷至尊 GX1050 GOLD 电源基于主动式 PFC、全桥 LLC 谐振拓扑、同步整流、DC to DC 结构打造,单路 + 12V 输出设计,其中 + 12V 最高电流为 87.5A,相当于 1050W 额定功率,完全可以应对显卡和处理器对电力的苛刻需求。
接下来,我们通过 3DMark 来看一下 GeForce RTX 3080 Ti 的理论表现。
Fire Strike 测试中我们看到,GeForce RTX 3080 Ti 显卡 DX11 Fire Strike Extreme 得分 22439 分,Fire Strike Ultra 得分 11817 分。
Time Spy 测试中,GeForce RTX 3080 Ti 显卡 DX12 Time Spy 得分 18871 分,Time Spy Extreme 得分 9731 分。由于 CUDA 核心数量 GeForce RTX 3080 Ti 与 GeForce RTX 3090 非常接近,所以我们看到 Time Spy 测试与 Fire Strike 测试二者在数据上也几乎持平。
在 Port Royal 和 DirectX 光线追踪功能测试中,由于整体计算单元 GeForce RTX 3090 更胜一筹,所以在光追能力上 GeForce RTX 3080 Ti 略低于 GeForce RTX 3090。DLSS 能力上同样如此。
通过理论测试我们看到,在常规的 DX11 和 DX12 表现上,GeForce RTX 3080 Ti 与 GeForce RTX 3090 表现非常接近,相比于 GeForce RTX 3080 显卡提升在 17% 上下,相比于 GeForce RTX 2080 Ti 则有接近 50% 的性能提升。光追表现上,GeForce RTX 3080 Ti 相比于 GeForce RTX 3080 提升约 10%,相比于 GeForce RTX 2080 Ti 提升约 60%。接下来,我们通过常见的游戏场景对 GeForce RTX 3080 Ti 显卡进行测试。
游戏场景
在游戏测试场景中,IT之家选择《光明记忆:无限》测试工具、《边境》测试工具、《地铁:逃离》测试工具、《孤岛惊魂:新曙光》、《古墓丽影:暗影》、《刺客信条:奥德赛》、《彩虹六号》等几款游戏进行测试,测试均在 1080P 场景下进行。
首先,我们针对 DLSS 功能,来看一下 GeForce RTX 3080 Ti 与 GeForce RTX 3090 之间的差别。测试数据如下:
通过《光明记忆:无限》、《边境》、《地铁:逃离》三款游戏不同强度的 DLSS 测试,我们看到,在 DLSS 游戏帧率的增益能力上,GeForce RTX 3080 Ti 与 GeForce RTX 3090 之间可谓是难分伯仲。虽然在《光明记忆:无限》和《边境》测试中,GeForce RTX 3080 Ti 表现略逊色于 GeForce RTX 3090,但实际差距也就是 3 帧以内的事情。GeForce RTX 3080 Ti 在《地铁:逃离》测试中,更是超越 GeForce RTX 3090。这与理论测试中表现基本一致。
再来看一下《刺客信条:奥德赛》、《彩虹六号》、《孤岛惊魂:新曙光》三款育碧游戏的表现,在相同画质下,GeForce RTX 3080 Ti 在育碧的三款游戏平均帧率基本上也都是超越 GeForce RTX 3090 的。
在光线追踪的表现上,IT之家选择《古墓丽影:暗影》进行测试,在默认最高画质 / 关闭 DLSS 情况下开启不同质量的光追效果,测试数据如下:
虽然在理论测试中,GeForce RTX 3090 的跑分数据相比于 GeForce RTX 3080 Ti 更高一些,但在实际游戏体验上,GeForce RTX 3080 Ti 光追性能表现整体还是略胜于 GeForce RTX 3090。
整体来看,GeForce RTX 3080 Ti 在实际的游戏性能表现上与 GeForce RTX 3090 难分伯仲,很大一部分原因还是二者使用的 GA102 核心太过相似,二者在游戏表现上基本上是五五开。接下来,我们看一下 GeForce RTX 3080 Ti 的散热和功耗表现。
散热与功耗
其实在测试开始前,我们不难猜出测试结果,毕竟 GeForce RTX 3090 与 GeForce RTX 3080 Ti 核心基本一致,TGP 甚至都是 350W,但体积上 GeForce RTX 3080 Ti 相比于 GeForce RTX 3090 小一圈,因此实际散热表现可会比不上 GeForce RTX 3090。
IT之家使用 Furmark 进行压力测试,测试对比了公版的 GeForce RTX 3090 和 GeForce RTX 3080,测试数据如下:
通过测试我们看到,GeForce RTX 3080 Ti 峰值功耗在 350W 上下,由于核心发热较大,其实际温度也接近 78 度。这也确实反映出来,小一号的 GeForce RTX 3080 Ti 在散热上的劣势。不过,对比 GeForce RTX 3090,GeForce RTX 3080 Ti 就凸显出来了,公版散热的问题交给散热更好的非公版解决,它不香嘛!
总结
这次英伟达的大刀又是对 GeForce RTX 3090 的一次精准切割,GeForce RTX 3080 Ti 虽然在显存容量和体积上更小,但实际表现强劲,和 GeForce RTX 3090 几乎平起平坐。
最关键的是,GeForce RTX 3080 Ti 公版价格还比 GeForce RTX 3090 便宜 3000 大洋,虽然少了 12GB 的显存,但整体性能并没有受太多影响,这届 GeForce RTX 3080 Ti 可是真香啊。当然,香归香,有货才是王道。
相关新闻