首页 > 电竞资讯 > 电竞硬件评测

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

小黑盒 电竞硬件评测 2020-09-16 23:06:18 电竞硬件评测   电竞评测   显卡   3080

  即便AMD短时间内无法撼动NVIDIA在显卡领域内的地位,但NVIDIA仍然没有停下推进GPU技术发展的脚步。年初的NVIDIA A100已经暗示了安培Ampere架构GPU开始进入量产状态,直至本月初,GeForceRTX 3000系列消费级显卡正式进入大伙视野。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  不能否认,GeForceRTX 2080 Ti已经给予大多数玩家性能游刃有余的满足感,但随着GeForceRTX 3000系列的价格策略推出,曾经的万元卡皇忽然就不香了。

  在NVIDIA官方宣传中,3899元起的GeForceRTX 3070性能比GeForceRTX 2080 Ti更快,5499元起的GeForceRTX 3080更是能够两倍于GeForceRTX 2080的性能,更不要旗舰11999元起的GeForceRTX 3090显卡。

  也就是说,昔日售价破万的卡皇RTX 2080Ti瞬间掉到了4000元档位,GeForceRTX 3000系列的性价比在还没有发售便已凸显。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  那么问题来了,究竟是什么让NVIDIA新显卡弄哭了无数男孩子?趁着NVIDIA GeForceRTX 3080 FoundersEdition测试解禁,我们一起来读懂安培Ampere架构,GA102芯片,以及RTX 3080性能究竟如何。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  GA102:结构上的再度优化

  无论GeForceRTX 3080还是GeForceRTX 3090,GA102核心都是一个绕不过的话题。在硬件上GA102进行了几项更新,其中最大的改变是在三星8nm工艺定制版本下,晶体管尺寸得到大幅缩小,使得GA102装下更多内容。从大体上来说,GA102核心使用的是三星8nm英伟达定制工艺,芯片面积(DieSize)达到628.4 mm²,总共包含了283亿个晶体管。

  这并非NVIDIA第一次定制工艺,图灵Turing架构的12nmFFN本身就是台积电16nm工艺的优化版本,两者之间晶体管密度相同。同样三星8nm定制与三星10nm工艺之间也不会有太大区别,但相对GA100上的台积电7nm工艺,价格更便宜且良品率更高,为GeForceRTX 3000系列后续的价格调整留足空间。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  即便如此,对比12nmFFN的图灵Turing架构,那提升就相当明显了,一个完整的GA102核心内拥有7个GPC(图形处理簇),每个GPC 里包含有 6 个 TPC(纹理处理簇),每个 TPC里有两个StreamingMultiprocesor(流式多处理器,SM,对应 OpenCL 中的概念就是 CU,Computing Unit),每个SM里包括128个CUDA Core。

  因此计算下来总共10752个CUDACore,84个第二代RT Core,以及336个第三代TensorCore。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  需要注意的是,GeForceRTX 3080和GeForceRTX 3090都没有使用完整的GA102核心。在GeForceRTX 3090的GA102-300-A1中,屏蔽了2组SM,最终获得10496个CUDA Core、82个RT Core,328个TensorCore。

  同样,GeForceRTX 3080的GA102-200-KD-A1,屏蔽了1个GPC以及额外的4个SM和2组32bit内存控制器,可惜的是也屏蔽了第三代NVlink,目前为止仅有RTX 3090拥有使用SLI NVLink功能。最后GeForceRTX 3080获得8704个CUDA Core、68个RT Core,272个Tensor Core,以及320bit的内存总线。

  因为今天的主角是GeForceRTX 3080,这里我们先放出一组RTX 2080、RTX 2080 Super的参数对比,方便大家能有更为直观的理解。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  安培Ampere架构的改变重点就在SM包含的CUDA Core数量和分配机制。在图灵Turing中,4个SM共享2个数据通道,但只有其中1个数据通道可以进行FP32操作,另外1个仅限INT32使用。而在安培Ampere GA10X系列中,引入了新的数据通道和多一倍的FP32 运算单元,使得每个SM的FP32运算单元数量提高了一倍,每个SM每个周期可以跑128个浮点FMA操作或者256次浮点计算。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  更具体的说,在图灵Turing SM中原本用于整数运算的INT32单元变成了FP32 + INT32运算单元,根据需求不同,单元会在FP32和INT32之间切换,这使得FP32单元在使用时成倍增加。而INT32数量变成FP32的一半其实更符合新游戏对浮点运算的要求,单元之间兼职切换也司空见惯。

  这样的形式也并非没有缺点,这使得处在混合通道中FP32和INT32在同一个周期中只能执行其中一个指令,但由于每4个SM中仍然有1个数据通道留给FP32,在宏观层面依然是FP32和INT32并发执行。从这点来看安培Ampere的灵活度更高。

  事实上安培Ampere架构也远不止于如此,除了2倍的FP32运算单元,NVIDIA还做出了如下改进:

  GDDR6X显存

  PCIe4.0接口

  第二代RT Core

  第三代TensorCore

  为了让文章看起来更为直观,我们会从传统的性能对比入手,然后深入光线追踪和DLSS,通过实战环节,方便大家能够更清楚的了解GeForceRTX 3080。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  跑分先行

  了解显卡最直接的形式依然通过最直观的分数对比,这里我们先介绍一下尽量不拖后腿的平台,并使用GeForceRTX 2080 SuperFoundersEdition、GeForceRTX 2080 TiFoundersEdition作为陪跑:

  CPU:IntelCorei9-10900K

  主板:ROG MAXIMUS XII EXTREME Z490

  内存:ThermaltakeToughRamRGB DDR4-4600 8GBx2

  硬盘:PlextorM9P Plus1TB

  电源:ThermaltakeTPI RGB PLUS 1250W

  散热:ThermaltakeFloe Riing RGB 360

  这里特意使用了ThermaltakeToughRamRGB DDR4-4600。理由是4600MHz高频率在一定程度上保证了游戏在高帧率时仍然能够稳定运行。内存本身少折腾,直接开启XMP 2.0,双通道稳定冲上4600 C19,10层电路板设计、铝合金散热片有效确保超频稳定。当然,夜间也少不了1680万色10颗高流明可独立编程LED灯。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  在3DMark Time Spy、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra项目中,RTX 3080相对RTX 2080 Ti有25%以上的提升,而相对RTX 2080 Super,提升可以达到40%到50%之间。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  同样用来测试VR性能的VRMark项目中,RTX 3080均有着明显的提升。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  大跨步的提升不仅因为GA102拥有更多的晶体管和效能,同样还因为GeForceRTX 3080上首次搭载了GDDR6X显存,这是由美光和NVIDIA共同开发的GDDR6进阶版。GDDR6X旨在通过在内存总线上使用多级信令来实现更高的内存总线速度,并获得更大的内存带宽。

  GDDR6X厉害的地方在于,能够每个时钟内发出4个不同的信令,本质上是每个时钟内实现2次位移,并且分成4级电压阶跃(4种信号电平),也就是在高速网络中开始运用的PAM4信令技术。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  这使得原本一个信号编码只能用0和1表示,变成了如下图这般四种编码模式,即00、01、10、11。相反的,PAM4则需要更复杂的控制器来处理多信号状态。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  细心的同学会发现,GeForceRTX 3080在拥有更多的晶体管数量的同时,使用了更高1.7GHz以上更高的频率,仅比晶体管不到一半的RTX 2080 Ti低100MHz。高频率+海量晶体管数量意味着显卡功耗不低,因此GeForceRTX 3080 TGP也达到了320W。

  根据NVIDIA官方表示安培Ampere的电源效率提高了1.9倍,如果按照纸面参数推论,假设GeForceRTX 3090性能提升了50%,那么功耗增加了25%,能耗效率应该增加了20%左右。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  更高的频率和发热量让GeForceRTX 3080在外观上带来了全面的改变。由于PCB面积压缩到了RTX 2080 SUPER的一半,并且使用了不规则的形状,更高的元件密度势必给布线带来了更多的困难。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  在FoundersEdition版本中,GeForceRTX 3080也首次使用了12pin电源接口,随机会附送一个8+8pin转接12pin的线材。与此同时电源接口自带了一定角度。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  这样做的好处是NVIDIA重新定义了一套特殊的前后双风扇系统,后方被裁减掉的PCB作用是给后方的风扇腾出向上出风的位置。形成了类似下图的机箱风道:

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  也因为如此,FoundersEdition版本的拆卸变得非常困难,但能获得更好的静音和散热效果。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  在压力测试中,可以明显感受到显卡表面温度提升迅速,RTX 3080正反面的温度均提升到了70摄氏度以上。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  高效散热与之换来的则是GPU核心温度维持在普遍水准,压力测试下RTX 3080的最高温度仍然比RTX 2080 Ti低得多。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  另外,RTX 3080也是NVIDIA首次在桌面消费级显卡上引入对PCIe4.0支持。由于PCIe4.0比3.0带宽高出一倍,但目前英特尔尚无推出民用PCIe4.0平台,是否意味着接下来一段时间是AMD的主场?

  答案是否定的。与PCIe2.0转到3.0时代类似,带宽提升在短时间内不会对显卡性能产生太多影响,这里我们使用了3DMarkPortRoyal以及PCIe带宽测试,可以看到即使是在带宽翻倍的前提下,RTX 3080的性能也仅提升了0.1%都不到。

  因此可以认为更高的PCIe带宽在未来RTX IO到来的时候,给硬盘载入提供更好的发挥空间。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  4K游戏毫无压力

  早在GeForceGTX 980时代,NVIDIA已经开始野心勃勃进军4K游戏画面领域。进而到GeForceRTX 3080,在不支持DLSS的游戏场景中,也已经得心应手。

  在传统游戏测试的环节中,我们把画质都提升到了最高,并且除了《地铁:离乡》之外,均把画质提升到了4K。在绝大多数情况下,RTX 3080的320bit10GB GDDR6X应付高分辨率绰绰有余,60FPS以上已经十分轻松。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  在这个环节,RTX 3080相对RTX 2080 Ti有25%到47%的帧率提升,而相对RTX 2080 Super,提升更是达到54%到118%之间。

  请记住,以上内容仅限定在没有光线追踪和DLSS的测试项目中,游戏帧率的提升程度,随着游戏发布时间越近而提升越高,这也是一直所强调买新不买旧的道理。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  为了应对4K乃至8K的画面传输,RTX 3080也首次加入对HDMI 2.1支持,单口传输最高分辨率为8K @60Hz,相应的,其他接口保留了三个DisplayPort,其他位置均留给了出风口。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  光追和DLSS更进一步

  从RTX诞生之初,光线追踪和深度学习超采样几乎形影不离。很大原因由于光线追踪依然需要很强的运算能力,唯有与深度学习超采样DLSS互补,才能更合理的利用安培Ampere架构的资源。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  RT Core正是针对三角形求交测试遍历算法和BVH加速结构设计,从而也窥见NVIDIA在早期布局时已经与微软DXR不谋而合。

  说白了,加速光线追踪,从DXR或者RT Core角度看来,就是层次化包围盒BVH求交加速,亦或者三角形求交加速。

  在图灵Turing的RT Core每个周期中,BVH和三角形求交比重为4:1,也就是每完成4次BVH,在完成1次三角形求交,以实现三角形的命中。而在安培Ampere第二代RT Core中,NVIDIA又增加了1个三角形位置内插模块、1个三角形求交模块,也就是说,在一个周期中,完成4次BVH,在完成2次三角形求交。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  新增三角形位置内插模块,和追加三角形求交模块其实有些大胆,在一个周期的BVH遍历中照理说命中2个三角形的概率会下降。但庆幸图像画面是可预判的,特别是针对运动中的物体,2个新增的模块可以更快的实现三角形求交。特别是在启用运动模糊特效的前提下,安培AmpereRT Core性能整整提升了8倍!

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  与此同时,第三代TensorCore吞吐量提升了两倍,核心数量实际上没有增加,反而有所减少。原因是与NVIDIA A100的GA100看齐引入了稀疏化加速。在深度学习中,通过抛弃不必要的分支,在保证准确度的前提下减少运算,从而获得更高性能是可行的。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  第三代TensorCore支持细粒度模式下的50%稀疏化操作,这使得GA102的张量性能提升2倍,当然这还需要游戏和软件的支持和优化。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  更厉害的是,DLSS在将加入DLSS 8K模式,显卡只需要渲染2K,也就是2560x1440分辨率,通过AI和TensorCore再将分辨率提升到8K。也就是说通过人工超级分辨率技术将珍格格游戏画面分辨率提升了9倍。

  不过从目前的驱动来看,DLSS 8K尚未开放,先行购买8K电视的同学,还需要等一下NVIDIA后续的驱动更新。

  可以看到的是,RTX 3080的DLSS提升尤为明显,在3DMarkDLSS测试中,相比RTX 2080 Ti提升了近30%,是相对RTX 2080提升近60%。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  测试光线追踪性能的3DMarkPortRoyal表现也类似:

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  在光线追踪游戏测试环节中,我们引入了《光明记忆:无限》和《边境》两款国产游戏DEMO,在近两年的游戏发展中,国产游戏研发团队追捧新技术的趋势愈发明显,已经上线的《剑网3》、《逆水寒》网游,再到即将上线的《仙剑奇侠传七》均已经确认提供光线追踪和DLSS支持。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  不仅如此,在数日前更新的《堡垒之夜》也加入对光线追踪和DLSS的支持,并且细节设计也颇为丰富。NVIDIA还因此专门针对游戏设计了一个RTX创意场景,目前在这个地图中,也只有GeForceRTX 3080以上级别的显卡,才能够达到流畅的水准。

  同时《堡垒之夜》RTX场景提升效果也是最为明显的,GeForceRTX 3080对比RTX 2080 Ti提升了128%,对比RTX 2080 Super提升185%,接近2倍的性能提升。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  而从整体上而言,GeForceRTX 3080的光线追踪、DLSS组合拳十分有效果,对比RTX 2080 Ti性能提升在30%左右,而对比RTX 3080 Super,平均性能提升可以达到64%。

  最后我们将光线追踪游戏测试汇集成下表:

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  人均主播:NVIDIA Broadcast

  有趣的是,负责DLSS的TensorCore功能并非止步于此,在游戏直播和主播画面拍摄、降噪上,它也开始不断刷新自己的存在感。

  游戏之外,N卡让玩家最快的功能之一就是帮助玩家变身游戏主播。在GeForceRTX 20系列中,NVIDIA推出了NVENC编码器,可以更高效的利用GPU资源分担直播负载,并获得更好的串流效果。当前诸如斗鱼、虎牙、OBS、Discord、Streamlabs、Twitch Studio 和 Xsplit等直播应用君提供了对应NVENC的支持。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  而现在,NVIDIA打算在GeForceRTX 30系列上更进一步,新版本NVIDIA Broadcast在提供高质量直播串流的同时还能进一步提升直播体验。重点在于,这套功能是免费的,使用原有的摄像头和麦克风即可实现。

  利用GA102的AI加速功能,NVIDIA Broadcast能够实现消除麦克风背景噪音。通过AI网络对音源处理,无论是机械键盘还是室友的喧闹,都能一并消除。

  同时Broadcast本身还提供给了强大的虚拟背景功能,能够极速的抠出人像,并将其融入到虚拟背景或者游戏画面中。如果你的摄像头视野足够大,Broadcast还可以利用AI图像放大做成摄像头AI跟踪的效果,确保主播的头部随时处在屏幕正中央。

  事实上,Broadcast会被当成一套通用插件植入到主流的直播软件、语音聊天和视频会议中,包括GeForceRTX、TITAN RTX和QuadroRTX在内的硬件均能提供支持。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  NVIDIA Studio:把性能变成生产力

  游戏和直播领域之外,NVIDIA也希望GeForceRTX 3080能够扮演更重要的内容创作角色。早年专业软件对GeForce与Quadro的支持划分,在近几年愈发变得模糊。很重要的一个原因在于CUDA Core、RT Core以及TensorCore开始进入到专业软件领域,给准专业玩家提供多维度的尝试。

  例如,世界上第一个真正基于GPU实现物理渲染的Octane Render,通过它,可以利用GPU制造出包括Autodesk Maya、3ds Max、MAXON Cinema 4D在内的3D建模,完全独立的渲染编辑器可以应对不同的专业软件场景。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  因此Octane Render在2020.1.5版本后加强了对NVIDIA CUDA Core和RTX Core的依赖。从实际表现可以看到,RTX ON的状态下,场景渲染能力对比RTX 2080 Super和RTX 2080 Ti提升1倍到2倍。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  AdobePromiereProCC则是更广泛的被Vloger和B站up主所接受。早期版本的Promiere会过分依赖CPU的编码能力,在视频编辑、颜色矫正、视频过渡时才会使用上GPU,视频输出仍然依靠CPU来解决。

  NVIDIA GPU本身在硬件上已经具备了H.264和HEVC(H.265)的支持,对于专业视频软件而言,只需要接入NVIDIA的视频编码API,就能实现GPU视频制作的加速。因此在最新版的AdobePromiereProCC 2020中已经加入了对NVENC解码的支持。

  在软件中的设置非常简单,只需要确保项目设置中的渲染程序基于CUDA加速,并且视频输出的时候由硬件执行即可。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  这里通过一段大约3分钟的4K视频压缩的对比可以看出,GeForceRTX 3080的视频输出是最快的,酷睿i9-10900K和RTX 2080 Super处在同一个水平。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  相比文字工作、图片和视频工作者的所见即所得,设计师通常需要大量的时间等待硬件渲染。初期效果在渲染输出之前基本全靠脑补。而现在开始不断有渲染器开始尝试利用RTX GPU实现缩减即所得的效果。国产渲染器D5 Render就是其中之一。

  在实时渲染的场景中,D5 Render能够直观的开启光线追踪后的效果。而实时光线追踪在DLSS的配合下,GeForceRTX 3080预览已经达到35FPS以上,体验足够流畅。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  RTX OFF

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  RTX ON

  考虑到客户也能浏览到场景效果,渲染成图片、全景照片、视频也是不错的手段。这里我们在开启DLSS和RTX的前提下,将场景输出为一段2K分辨率12秒的视频,对比如下,能够看到RTX 3080花费的时间几乎只有RTX 2080 Super的三分之一,RTX 2080 Ti的一半。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  写在最后:游戏与创造两手抓

  NVIDIA GeForceRTX 3080只是安培Ampere架构进军消费市场的一个开始,但通过这块非完整版的GA102核心,我们已经一窥到GeForceRTX 30系列一丝进攻的味道,便宜、大碗,NVIDIA在没有竞争对手的前提下依然提高了性价比的门槛。

  GeForceRTX 3080也不再是个单纯的游戏GPU,AI运算、专业软件加速的任务也同样划到了它的名下,这也使得GeForceRTX 3080功能性十足。

NVIDIA GeForce RTX 3080首测:游戏创意两手抓,性能强到没朋友

  很快,随着英特尔支持PCIe4.0的平台发布和微软Windows DirectStorage API推出,通过RTX IO加速游戏读取更让人期待,这将是一场游戏场景切换体验的革新,而GeForceRTX 30系列无疑会成为这场硬件升级的主角。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:https://www.estime.cn/news/3/19645.html

留言与评论(共有 0 条评论)
   
验证码:

电竞时代

https://www.estime.cn/

| 京ICP备19054296号-1

Powered By 电竞时代 电竞时代传媒旗下网站

使用手机软件扫描微信二维码

关注我们可获取更多电竞资讯