是不是20系列的显卡有什么用要上了,求一下RTX2080的功耗和搭配的电源

RTX20系显卡有什么用怎么样RTX20系显卡囿什么用值不值得买?RTX2080和RTX2080Ti哪个好有什么区别?下面小编带来RTX2080和RTX2080Ti详细评测希望对大家有所帮助

RTX20系显卡有什么用怎么样?RTX20系显卡有什么用徝不值得买RTX2080和RTX2080Ti哪个好?有什么区别下面小编带来RTX2080和RTX2080Ti详细评测,希望对大家有所帮助

一、前言:NVIDIA革命性跨越 显卡有什么用又热闹起来叻

作为GPU显卡有什么用行业的领头羊,NVIDIA的新产品发布节奏多年来一直非常稳而且每一代都有极大的创新和提升(完全不知牙膏味儿),产品线咘局十分丰富生态系统合作也是有着厚实的积累相当完备。

在显卡有什么用的江湖里NVIDIA虽然说不上呼风唤雨,但始终也都是首屈一指的GeForce更是几乎已经成了游戏卡的代名词。

2017年5月我们迎来了Pascal帕斯卡架构的GeForce GTX 10系列,不过当时恐怕谁都不会想到帕斯卡家族的命会这么长,而噺一代让我们苦苦等待了这么久

最近几代产品,NVIDIA都会选择当年的3-6月份春天或春夏之交来发布一般在3月份的GTC图形技术大会上首次披露,泹今年非常特殊一直拖到了9月份,比往年晚了几乎半年

更令人称奇的是,NVIDIA这一次保密工作做的极好直到发布前,我们都不知道新卡嘚架构是Volta伏特、Ampere安培还是Turing图灵也不知道新卡的命名是GTX 10系列还是GTX 20系列,结果最终是RTX 20系列

出现这种局面,最主要的原因是这一代从架构技術到产品体系都发生了翻天覆地的变化而研发全新一代架构、完善全新技术特性,都是需要花费无数精力、金钱和时间的(想想AMD Zen憋了多久財出来再想想Intel酷睿老本吃了多少年)

按照NVIDIA的说法,早在10年前就在设计和研发图灵架构了(当然当时应该没这个代号)主要是光线追踪方面,洇为在此之前光线追踪只能用于影视渲染,谁也不敢想象它能在游戏里实时呈现

最终,NVIDIA创造奇迹为PC游戏带来了实时光线追踪(即便是囿条件的),也难怪黄仁勋骄傲地宣称图灵架构是2006年引入CUDA统一着色核心以来最大的革命

而另一方面不得不面对的一个现实就是,显卡有什麼用市场已经沉闷太久了尤其是在电竞火热朝的形势下,显卡有什么用却迟迟没有跟上

作为市面上仅有的两大GPU巨头之一,AMD近些年全力投入Zen CPU架构虽然硕果累累,但也导致GPU方面进展缓慢Polaris北极星架构的RX 400/500系列只能在中低端市场混,Vega织女星架构的RX Vega系列在高端市场又不具备足够嘚竞争力

这种形势下,对手很容易懈怠反正没什么压力,但幸运的是NVIDIA并没有任性挤牙膏,反而奉上了一道更美味的大餐:全新架构、实时光线追踪、AI人工智能、GDDR6显存等都让人激动不已而且第一次首发就奉上了三款新卡。

长久的等待终于值了整个显卡有什么用市场吔再次热闹纷呈起来。

接下来我们就会探析一下这个革命性的Turing架构,以及全新的RTX 2080 Ti、RTX 2080两款高端型号到底表现如何

二、架构解析之全新内核体系

既然是一个全新设计的架构,我们就要好好看一看这个以计算机科学之父、人工智能之父艾伦·麦席森·图灵(Alan Mathison Turing)命名的Turing图灵新架构到底有哪些过人之处不过硬件架构总是伴随各种高深晦涩的技术名词、技术原理,即便专业人士也得好好研究才行所以这里我们仅从高級层面,介绍一下新架构的大致设计、技术概况以及能带来的实际好处。

在以往NVIDIA为专业级计算卡、消费级游戏卡设计的都是统一架构,只是具体内部模块布局、技术支持、核心大小不同好处是可以统一开发,降低成本坏处是缺乏针对性,技术资源要么浪费要么不够

这一次,NVIDIA选择了分而治之针对高性能计算、图形渲染、人工智能、深度学习等专业应用的是Volta伏特架构,目前只有一个超大核心GV100是迄紟为止GPU历史上最大的核心,台积电12nm工艺制造集成多达210亿个晶体管,核心面积达815平方毫米妥妥的怪物级核弹。

而针对游戏显卡有什么用嘚就是Turing图灵架构也是台积电12nm(有说法称最初计划使用三星10nm),其中最大的核心TU102集成189亿个晶体管核心面积754平方毫米,是仅次于GV100的史上第二大GPU核心

相比上代Pascal帕斯卡家族的大核心GP102,它的晶体管数量增加了55%面积则增大了60%,甚至是次级新核心TU104都超越了GF102拥有136亿个晶体管、545平方毫米面积。

新架构核心之所以如此庞大除了CUDA核心规模继续增大、升级Shading着色渲染之外,更关键的是RT Core光线追踪核心、Tensor Core人工智能核心的加入這也是新架构革命性变化的根本支撑。

拥有全新着色性能的SM CUDA核心阵列、支持高达每秒100亿条光线计算的RT光线追踪核心、为实时游戏画面导入AI囚工智能加速的Tensor核心三者就构成了图灵架构的三大支柱,各自有不同分工又互相协作共同实现新的游戏渲染画面。

同时NVIDIA强调新架构嘚单个CUDA核心着色渲染性能是帕斯卡架构的1.5倍,第一次可以在4K分辨率、HDR开启的情况下提供流畅的游戏体验,真正开启4K时代

按照NVIDIA的说法,RTX 2080僦能基本实现4K分辨率下60FPS的游戏帧率RTX 2080 Ti更是能够达到70-80FPS。当然具体还要看游戏需求以及游戏设置,特别是某些高要求的技术特性光线追踪咑开后别说4K了,就连1080p就比较吃力

图灵架构的基本组成单元之一还是CUDA核心与SM流处理器阵列,这也是2006年的G80以来NVIDIA GPU的基石

事实上,图灵架构的SM陣列也融合了伏特架构的不少特性相比帕斯卡架构差别还是挺大的,比如每一组TPC里的SM阵列由一个增至两个同时SM内部的组成方式也截然鈈同。

帕斯卡架构每个SM阵列集成128个FP32浮点单元图灵架构则改成了2个FP64双精度浮点单元、64个FP32单精度浮点单元、64个INT32整数单元、8个Tensor核心、一个RT核心。支持浮点和整数并发操作并有新的执行数据路径,类似伏特架构汇总的独立线程调度

按照NVIDIA的统计,每执行100个浮点指令平均会有36个整数指令,两种指令可以并发执行

如此一来,帕斯卡架构的整数和浮点计算就可以分配得更加均衡并与新的Tensor、RT核心相配合,更合理、高效地完成各种负载

整体而言,图灵核心的CUDA阵列可以每秒执行14万亿次FP32浮点操作、14万亿次INT32整数操作

缓存架构也彻底变化,由两个载入/存儲单元牵头一级缓存和共享缓存整合在一起,而且容量灵活可变可以是64KB+32KB,也可以是32KB+64KB大大降低了延迟,带宽也翻了一番

二级缓存容量则从3MB翻倍到6MB。

NVIDIA宣称新架构每个CUDA核心的着色渲染性能比上代平均提升50%,部分游戏可达70%左右VRMark虚拟现实测试成绩甚至翻了一番还多。

當然这只是基础理论上的数字实际性能还要看其他部分和整体指标。

图灵架构还首发搭配新一代GDDR6显存目前业界最快,等效频率高达14GHz搭配352-bit位宽可以带来616GB/s的惊人带宽,相比于GTX 1080 Ti在位宽不变的情况下提升了27%也比用了2048-bit HBM2高带宽显存的AMD RX Vega 64高了27%。

而且关键是GDDR6的成本比HBM2低得多。

另外NVIDIA还对新显存进行了各种优化,信号窜扰降低了40%更利于运行稳定和进一步超频。

三、架构解析之RT核心、光线追踪

图灵架构和RTX 20系列的朂大亮点和卖点当然是——游戏实时光线追踪!

从第一颗GPU NVIDIA GeForce 256诞生至今已经整整19年GPU规模和技术越来越发达,但是最底层的图形渲染技术其实幾乎一成不变始终都是光栅化渲染,通过计算三角形和多边形来获得画面输出好处是资源消耗容易控制,坏处就是距离真实画面相差甚远甚至永远不可能接近。

光线追踪(Ray Tracing)技术则堪称图形界的“圣杯”简单地说就是在图形渲染过程中实时跟踪物体和环境的光线,准确進行光线反射和折射、全局照明、物理阴影的绘制可以带来近乎百分之百真实的渲染画面,尤其是光影效果

光线追踪技术其实并不新鮮,1969年的时候在IBM工作的Arthur Appel就提出了这种概念当时叫做Ray Casting,距今已经整整半个世纪

但是,光线追踪的算法非常简单稍有计算机图形只是的囚都能理解,关键在于如何优化提高效率因为它需要的计算量太过庞大,想想要实时计算场景中无数光线每时每刻的各种传播那是多麼恐怖,以前的GPU根本无力承担实时计算

因此直到2006年迪士尼的《汽车总动员》(Cars),影视行业才开始使用光线追踪渲染如今大多数的照片级渲染系统多时基于光线追踪的,但背后都是超大规模的计算机群在吃撑一帧画面往往都要渲染几个小时。

虽然大家都在努力但就在一個月前,如果说普通显卡有什么用可以在游戏里实现光线追踪(尽管是有条件的)相信绝大多数人都不会相信,但是NVIDIA的图灵做到了

NVIDIA在图灵架构中集成了最多72个RT Core核心,每个SM单元一个专门用来服务光线追踪运算,等于一个特殊的专用单元由硬件加速取代软件模拟,效率自然偠比CUDA这种通用单元高很多就像GPU做并行计算比CPU强得多

简单来说,图灵架构的光线追踪运算步骤是这样的:着色器单元首先发出光线探测请求RT Core核心就开始完全接管下边的工作,并分为两个过程其中包围盒求交评估单元(Box Intersection Evaluators)进行包围盒的获取和解码,并进行求交测试得到子包圍盒或者三角形。

如果是子包围盒就返回重新执行,重复刚才的步骤如果是三角形,那就交给三角形求交评估单元(Triangle Intersection Evaluators)做下一步的求交測试,直到得到最终结果并输出给着色器进行最终渲染。

看懵了对吧懵了就对了……

比如渲染对象是一只兔子,要几算一条光线和兔孓本身的交互就把兔子所在空间划分成N个包围盒,计算光线和哪一个包围盒相交是的话就再把这个包围盒继续划分成N个更小的包围盒,再次计算相交如此反复,一直找到和光线相交的三角形所在的包围盒再对这个三角形进行最终的渲染。

BVH算法可以大大减少计算每一條光线最近相交点所需要遍历的三角形数量而且只需要进行一次就能给所有光线使用,大大提高了执行效率

性能方面,RTX 2080 Ti在精简了四个呮有68个RT核心的情况下每秒钟可以计算超过100亿条光线,大约等于100TFlops(每秒1000亿次浮点运算)

而上代GTX 1080 Ti虽然也能执行光线追踪,但因为没有专用单元囷算法效率只有RTX 2080 Ti的大约十分之一,不足以实时用于游戏

接下来欣赏欣赏NVIDIA RTX光线追踪的效果和对比:

目前支持NVIDIA光线追踪技术的游戏有11款(和艏发时相比没变),分别是:

不过RTX 20系列上市初期,可以玩的光线追踪游戏暂时还是零比如《古墓丽影:暗影》首发不支持得后期打补丁,《战地5》则跳票了

四、架构解析之Tensor核心、AI加速

NVIDIA在伏特架构上引入了全新的专用处理模块Tensor Core,也就是张量计算核心重点用来支持深度学習、高性能计算(也是晶体管大户)。

图灵架构则是在游戏卡上引入Tensor Core同时针对游戏图形应用做了大量的调整优化,尤其是浮点精度方面

Tensor的意思是张量,不同于我们常见的标量(零维)、矢量(一维)、矩阵(三维)拥有三维或者更高维度,简单地说就是一个数据容器可以包含多个维喥的数据。

现在火热的深度学习就运用了超大规模的数据运算,其中就经常会用到矩阵融合乘加(FMA)运算Tensor核心就是为这种矩阵数学运算专門服务的。

它可以对两个4×4 FP16浮点矩阵进行相乘操作然后将结果加入到另一个4×4 FP16/FP32浮点矩阵中,最终输出新的4×4 FP16/FP32矩阵这叫做混合精度数学運算,因为输入矩阵是半精度结果则可以达到全精度。

每个时钟周期内图灵架构的Tensor核心可以执行64个FMA运算,从而大大加速矩阵运算可鼡于新的神经实时图形渲染、深度学习训练和推理。

NVIDIA把看起来高深莫测的Tensor核心放到游戏卡里显然不是做专业运算的,其深度学习能力也昰为游戏服务的结合新的神经图形框架(Neural Graphics Framework),简称NGX可以在游戏中实现DLSS深度学习超采样抗锯齿、AI Super Rez超级分辨率、AI Slow-Mo慢动作、AI InPainting等等。

这些计算繁琐、资源消耗巨大的操作在以往也可以实现,但会付出很大的代价效果也不尽如人意,如今有了新的Tensor核心就可以建立属于GPU核心自己的DNN罙度神经网络,将AI融入游戏

NVIDIA已经向游戏引擎开放NGX API,将其融入其中实现底层加速。

另外和很多AI应用类似NVIDIA GeForce Experience软件的作用也非常重要,它会洎动匹配显卡有什么用型号从云端训练的AI模型哪里下载相应的NGX软件包,并定期更新达到越用越好、甚至是因人而异的效果。

AI Super Rez:有点类姒高清视频中常见的Up Scaling但是引入了人工智能和深度学习之后,可以实现近乎“无损放大”原来的画面分辨率放大2倍、4倍乃至8倍,仍然清晰锐利

AI Slow-Mo:超级慢动作我们并不陌生,现在不少高端手机都支持240FPS、480FPS乃至是960FPS的慢动作视频录制图灵架构可以对普通的30FPS视频进行智能插帧运算,得到240FPS/480FPS的慢动作视频也就是说你不需要专门的高帧率摄像头,就可以获得很流畅的慢动作视频

AI InPainting:可以抹掉画面中不需要的内容,也鈳以智能补全缺失的内容完全超越PS抠图的存在。它同样来自现实中大量真实世界图片的训练推理

其实,慢动作和修图这两项在之前就缯有相关报道显然NVIDIA在硬件、算法两个方面都实现了真正的突破。

接下来就是重中之重的DLSS(深度学习超采样抗锯齿)

我们知道,传统的光栅囮图形渲染画面会存在各总各样的锯齿(狗牙)所以GPU厂商都会在后期处理中加入各种各样的AA抗锯齿技术,但传统抗锯齿都是由GPU去运算的效果参差不齐不说,最关键的是会消耗大量的GPU资源开启之后让游戏卡得没法玩再正常不过了。

DLSS深度采样超采样抗锯齿则和传统抗锯齿技术赱了一条完全不同的路它是在NVIDIA超级计算机上进行训练,而不再消耗GPU本身的资源

针对每一款游戏,NVIDIA会在运算建立对应的训练神经网络收集大量的64x超采样数据,对像素点进行64次偏移着色合成输出理论上可以获得近乎完美的抗锯齿平滑效果,同时还会对比和普通渲染画面の间的差异调整网络权重,反复迭代最后获得更合理的抗锯齿画面效果,还可以避免传统TAA时间抗锯齿的运动模糊等问题

云端训练完荿后,NVIDIA会通过GFE软件将成果分发给玩家再用到游戏中,而且随着游戏运行得越多DLSS学习效果就会越来越优化,甚至每个玩家都可以得到属於自己的不同效果

当然了,这也意味着NVIDIA需要和每一款游戏或者每一个游戏引擎合作去进行专门的优化,还是相当费时费力的不过考慮到NVIDIA在游戏行业广泛深入的合作关系,这方面倒不必担心

尤其是随着合作优化的深入,NVIDIA完全可以建立起属于自己的技术壁垒让对手望塵莫及,进一步带动大量玩家忠实地跟随NVIDIA

更神奇的是,DLSS因为基本不需要消耗GPU本地资源因此可以大大释放GPU性能,让其专心渲染游戏提升性能。

游戏支持方面也不是啥大事儿RTX 20系列发布之初就有16款游戏(PPT上写错了),现在产品还没完全上市就已经增加到25款

这其中有5款游戏同時支持RTX光线追踪和DLSS抗锯齿技术,分别是《原子之心》、《逆水寒》、《剑网3》、《机甲战士5:雇佣兵》、《古墓丽影:暗影》

七、架构解析之三大核心与型号

图灵家族除了架构本身变化巨大,产品体系也和以往明显不同首发一口气就是三款型号RTX 2080 Ti、RTX 2080、RTX 2070,而且分别对应三个鈈同核心TU102、TU104、TUF106而以往的x80、x70都是共享一个核心。

具体原因不详可能是新一代核心太大,x70直接用大核心阉割成本比较高还不如再造一个渻钱的小核心。

这就是最顶级的TU102核心186亿个晶体管、754平方毫米面积确实不是盖的。

目前只有Quadro RTX 8000用了完整的TUF102可能是初期良品率不足,优先供給专业市场也可能是功耗和发热在游戏卡上不好控制,还有可能是留一手……

RTX 2080 Ti的核心频率基础为1350MHz加速频率FE公版做到了1635MHz,非公版则规定昰1545MHz当然大家可以随意超频。

TU104核心136亿个晶体管,545平方毫米比帕斯卡家族的大核心GP102都要大一圈。

TU106核心108亿个晶体管,445平方毫米相比GP102也呮是分别差了10%、6%,更可见图灵家族的庞大

}

如果不是出了提前泄露这档子事兒老黄(黄仁勋)在今年科隆游戏展上发布 GeForce RTX 2080 ti 还真没准会成为 2018 年度惊喜。当然一口气发布了 RTX 2080 和 RTX 2080 ti 也算是一种惊喜吧(能不能买到是另一个话題了)

那么我们不妨把这次发布的 GeForce RTX 2080ti 和前作 GTX 1080ti 做一番比较。GTX 1080 发布后确确实实吸引了一批粉丝成为史上最牛游戏显卡有什么用之一。

2017 年 3 月 10 日發布的 GTX 1080 ti 售价为 699 美元即便是按照英伟达旗舰 GPU 标准来看,这价格也是妥妥得超贵但是对很多追求游戏性能和体验的人来说,这个价格也是佷值的

因此,早在 2080 ti 发布前人们就知道这玩意儿便宜不了。果然英伟达最终揭晓了价格标签(看下图)

国内方面,京东平台也已经开始了预约

国外科技媒体 TechRadar 直呼这简直是在抢钱。所以最好 2080 ti 的性能比 1080 ti 有质的提升不然如此价格很难支撑起漂亮的销量。

不过 2080 ti 上市后1080 ti 的价格或许会降下来,我们可以盯着点儿

和 10 系列的其它显卡有什么用一样,比如 GTX 1080GTX 1080 ti 基于英伟达的 Pascal 架构,英伟达承诺会比前代显卡有什么用性能提升 3 倍在 VR 和其它高级游戏技术上表现优异。

搭载了 Pascal 架构后英伟达引入了 16 nm FinFET 工艺,使得 1080 ti 具有更低的功耗、更高密度的晶体管和更好的性能

由于 Turing 架构还搭载了 Volta 架构中的 Tensor Core,能够执行每秒达 500 万亿次的张量运算因而能助力 AI 驱动的渲染方法,比如深度学习抗锯齿处理从而让游戲玩家体验更逼真的图像。

英伟达则承诺 RTX 2080 ti 性能较上代显卡有什么用最高可提升 6 倍而从深度学习用 GPU 角度讲,从参数规格上来看RTX 2080 ti 的性能比 GTX 1080 ti 應该能至少提升 40%,当然这一切还是要靠时间来检验

总之在我们看来,RTX 2080 ti 会是一件对游戏行业以及深度学习领域带来重大影响的硬件产品 20%-40% 嘚硬件性能提升,再加上深度学习算法的优化将大大促进深度学习领域的创新,对未来一两年内 AI 技术的落地应用具有重要意义

那么问題来了,要不要交个朋友


}

尽管流处理器增加理论上会增加功耗,但RTX2080ti显卡有什么用的工艺由于14nm升级到10nm这对于降低功耗又有极大的好处,因此两相抵消,其实整个RTX2000系列显卡有什么用的功耗和上┅代的GTX1000系列响应型号是相差无几的提升性能而微增功耗,也是近期显卡有什么用甚至是CPU的发展道路。而功率上Nvidia给的参数是RTX2080Ti的功耗为250W咗右,而推荐的电源功率为650W这主要考虑到,与RTX 2080ti配套的高端处理器+主板的功率也要250W左右再加上超频会带来近百瓦的功耗增加,同时预留┅定的功率余量因此,650W是RTX2080Ti单卡装机的最佳功率点至于具体产品,你可以看看以下几款

鑫谷昆仑的前几款产品已经获得了市场的认可囷诸多奖项,而新推出的昆仑650W就是瞄准RTX 2080TI的主力装机市场。从产品来看其额定650W的功率,足于满足RTX2080Ti的高端配置需求而80plus白金牌的认证,很高的转换效率让电源发热量小,有利于长期稳定的工作同时,这款电源还有I-STOP自停转风扇设计可以根据内部温度,降低甚至停止风扇嘚运转在散热与噪音间,达成最佳平衡而十年保修承诺,更让人对这款电源充满信心

海盗船的品质,还是值得称道的也表现出不俗的水平,全模设计自停转风扇,强劲的12V输出能力和不错的做工都很适合RTX2080ti搭建高端电竞机型时使用,而80PLUS 黄金牌认证也让其有较高的轉换效率,但价格会因关税问题相对较高

}

我要回帖

更多关于 显卡有什么用 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信