耕昇抗鼎之作!首款非公版耕昇GTX570评测

太平洋科技
前言:如今新一代的顶级级别的显卡格局已经形成,也就是GTX580雄踞单卡单芯之王的宝座,而在2999元的价位上有GTX570与HD6970这两款次顶级级别的产品上演着新一代的“双城记”。对于发烧级玩家来说,既然肯付出将近一部低端计算机平台的价格来购买顶级显卡,从消费心理来看估计没什么消费者愿意看到自己手中的顶级显卡与其他人雷同,也就是他们一般都追求个性化的特征。不过厂商由于产能、工艺等客观限制而往往在顶级单品发布时很少有非公版的产品同步出现。不过这次耕昇可谓快人一步,推出了首款非公版的GTX570显卡,即耕昇 GTX570关羽版,这位“关公”可谓十分给力!
耕昇 GTX570关羽版图片评测论坛报价
由于性能与PCB设计、散热设计集成度不可调和的矛盾,很多厂商的顶级显卡均采用了原厂公版的设计,毕竟公版设计已经采用了标杆级别的用料与做工。不过这次耕昇成为了GTX570非公版一个敢于吃螃蟹的厂商,在GTX570推出一个月后发布了非公版GTX570,为玩家提供了差异化选择,这点还是值得一赞的。
非公版设计的耕昇 GTX570关羽版显卡
公版GTX570显卡
对于顶级性能定位的非公版显卡,我们更多地关注这款耕昇 GTX570关羽版显卡与公版GTX570显卡之间的各个细节上的对比。我们都知道,如果一款非公版显卡的综合设计水平比公版还要差,那么该卡就没有存在的意义了。除了具体显卡各个细节的对比外,以此为基础的性能、尤其是散热、噪音、功耗控制乃至超频性能的测试就是非公版显卡能否做到优于公版在使用体验上的体现。
显卡外观彰显着散热设计上的煞费苦心
本期测试显卡天梯指引位置如下:
在本期测试中,我们采用了显卡天梯图以便更直观地体现出显卡的具体性能以及对比测试显卡之间的性能高低。同时显卡的发展步伐日新月异,不断有新品上市与被淘汰,显卡天梯图也需要不断更新。其中必定有瑕疵之处,我们也真心希望广大网友对显卡天梯图上的不足做出批评指正。
PConline显卡产品天梯图说明:耕昇 GTX570关羽版显卡的默认频率为750/3900MHz(核心/显存频率),至于公版GTX570显卡的频率为732/3800MHz,故前者的性能比公版更好。不过在散热、PCB电气性能得到加强的情况下耕昇 GTX570关羽版显卡的超频能力才是体现该卡与公版进行对比时的最大优势所在。
Geforce GTX570定位介绍
在新一代顶级单卡GTX580发布后不到一个月,NVIDIA就马不停蹄地再次发布了基于GF110核心的旗舰级显卡GTX570,GTX570显卡的定位类似上一代的GTX470显卡,是一款仅次于旗舰GTX580显卡的次旗舰,不过作为与GTX470相同定位的GTX570,在性能上就要明显超越其上一代了,因为GTX570显卡与上一代旗舰GTX480一样拥有多达480个CUDA核心,而其他参数规格上虽有一定变化,但也是此消彼长,因此GTX570可谓是GTX480的一个升级改进版。
NVIDIA旗舰级显卡参数一览 | |||
显示卡 | GTX 580 | GTX 570 | GTX 480 |
核心代码 | GF110 | GF110 | GF100 |
制造工艺 | 40nm | 40nm | 40nm |
CUDA核心 | 512 | 480 | 480 |
核心频率 | 772 MHz | 732 MHz | 700 MHz |
Shader频率 | 1544 MHz | 1464 MHz | 1400 MHz |
显存频率 | 4008 MHz | 3800 MHz | 3696 MHz |
显存容量 | 1536 MB | 1280 MB | 1536 MB |
显存位宽 | 384-bit | 320-bit | 384-bit |
显卡供电 | 6+8 pin | 6+6 pin | 6+8 pin |
AMD旗舰级显卡参数一览 | ||||
显示卡 | HD6970 | HD6950 | HD6870 | HD5870 |
核心代码 | Cayman XT | Cayman Pro | Barts XT | Cypress |
制造工艺 | 40nm | 40nm | 40nm | 40nm |
流处理器 | 1536 | 1408 | 1120 | 1600 |
核心频率 | 880 MHz | 800 MHz | 900 MHz | 850 MHz |
Shader频率 | 880 MHz | 800 MHz | 900 MHz | 850 MHz |
显存频率 | 1375 MHz | 1250 MHz | 1000 MHz | 1200 MHz |
显存容量 | 2048 MB | 2048 MB | 1024 MB | 1024 MB |
显存位宽 | 256-bit | 256-bit | 256-bit | 256-bit |
显卡供电 | 8+6 pin | 6+6 pin | 6+6 pin | 6+6 pin |
GTX570和GTX580显卡一样,都是在上一代Fermi架构下的GF100核心基础上升级而来,可以看出GTX570与GTX480采用了数目一致的CUDA流处理器,但GTX570默认频率更高,虽然显存容量不如GTX480那样“海量”,但是从GTX570的首测可以知道,其基于的GF110架构比GF100架构在性能上有了明显的优化,使得性能测试上保持领先。
公版GTX570显卡
GTX570的宿敌:HD6970
2011年伊始,2999元价位的显卡市场呈现了GTX570与HD6970对抗的形势。从我们的显卡天梯图可以看到,HD6970已经是AMD显卡最强的单卡单芯产品,使得GTX580稳坐单卡单芯性能王者的地位。虽然AMD还有HD5970来把持最强单卡性能的宝座,不过客观上得益于双芯的设计,而HD6990还没露面,所以如今高端显卡的格局为GTX580、HD6950暂时没有竞争对手,而GTX570与HD6970之间的竞技已经火药味十足。
GTX570:采用480个CUDA核心设计的GF110核心
NVIDIA将采用完整512个CUDA核心设计的GTX580显卡核心命名为GF110,意为GF100核心的升级版,此次NIVDIA这款作为替代GTX470的第二代DX11次旗舰GTX570,依然沿用的是与GTX580一样的GF110核心,不过与上一代GTX470相比,GTX570拥有了多达480个的CUDA核心,整体数量与上一代旗舰GTX480一样,显卡的频率也由GTX480的700/3696提高到732/3800,不过在显存规格上面GTX570相对GTX480却由之前的1536MB/384bit降低为1280/320bit。
从上面关于GTX570与GTX480的规格介绍中不难看出,GTX570与上一代旗舰GTX480的参数非常接近,可以说GTX570就是在GTX480的基础上升级改进而来的一款显卡,因此这也注定了两者在性能上将非常接近。
下面我们简单的来了解一下这两款核心所采用的GF110核心。
GF110核心架构
完整的GF110核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存。
GF110核心每一组SM阵列里包含有32个CUDA核心,每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
另外,我们都知道DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。AMD在实现细分曲面时是整个核心共用一个多形体引擎,例如上图NVIDIA也可以在GT200的基础上加上一个多形体引擎来达到变身DX11显卡。
细分曲面技术实现原理
GF110:与GF100一样的三级分层游戏架构
Fermi GF110是一个全新架构并非没有道理,不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(Raster Engine)和多形体引擎(PolyMorph Engine)。
光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。
多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。GF100中有16个多形体引擎,每组SM一个,亦即每组GPC四个。需要说明的一点是AMD显卡在多形体引擎方面的设计采用的是所有SM共用一个多形体引擎,而NVIDIA采用的是每组SM一个,这样也就避免了多形体引擎称谓显卡性能瓶颈。
多形体引擎绝非几何单元改头换面、增强15倍而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。
在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。
除了ROP单元和二级缓存,几乎其他所有单元的频率都和Shader频率(NVIDIA暂称之为GPC频率)关联在一起:一级缓存和Sahder单元本身是全速,纹理单元、光栅引擎、多形体引擎则都是一半。
从NV30 GeForce FX 5800到GT200 GeForce GTX 280,NVIDIA显卡的几何性能只提高了不到3倍,而Shader性能提升了150多倍,但仅仅是从GT200到GF100,几何性能的增长倍数就达到了8x。
有了如此强大的几何性能,NVIDIA就可以使用细分曲面和置换贴图创建更复杂的人物、物体和场景,并保持和对手同样水平的性能,所以才有了16个多形体引擎和4个光栅引擎。
细分曲面是AMD DX11产品的宣传重点,但NVIDIA要做得复杂得多,而且理论上说效果更出色。接下来NVIDIA要做的就是让游戏开发商充分挖掘GF100架构的潜力,在保证性能的基础上做出更精致的游戏画面。
Fermi架构下的GF110核心更逼真的画面和更高效的计算
抖动采样(Jittered Sampling)实现更逼真画面
DX11详细定义了显卡需要提供的特性,但对渲染后端的工作涉及甚少,所以NVIDIA做了多形体引擎,还有抖动采样。抖动采样不是新技术,长期用于阴影贴图和各种后期处理,通过对临近纹素(Texel/纹理上的像素点)进行采样来创建更柔和的阴影边缘。它的缺点也是非常消耗资源。
DX9/10上抖动采样是分别拾取每一个纹素,DX10.1开始改用Gather4指令,NVIDIA则在硬件上使用单独一条矢量指令。NVIDIA自己的测试显示,这么做的性能大约是非矢量执行的两倍。
改进抗锯齿最高可实现32AA
CSAA是在G80 GeForce 8800 GTX上引入的,当时最高支持16x,如今不但提高到了32x,而且将色彩取样和覆盖取样分离开来,在32x CSAA中分别有8个和24个,无论性能还是画质都有明显提升。NVIDIA宣称,GF100 CSAA从8x到32x的平均性能损失只有区区7%。
在GF100上,Alpha to Coverage可以使用全部采样点(最多32个),而且有33个透明级别,透明多重采样抗锯齿(TMAA)的质量也因此得到了改进。
游戏计算(Compute for Gaming)
首先,CUDA架构的实现途径就多种多样,CUDA C、CUDA C++、OpenCL、DirectCompute、PhysX、OptiX Ray-Tracing等等不一而足。这其中既有NVIDIA自己似有的开发方式,也有开放的业界标准规范,开发商可以自由选择。
在游戏中,NVIDIA CUDA计算架构可以执行画质处理、模拟、混合渲染等等,实现景深、模糊、物理、动画、人工智能、顺序无关透明(OIT)、柔和阴影贴图、光线追踪、立体像素渲染等大量画面效果。值得注意的是NVIDIA这次新加入了队C++的原生支持。
《Metro 2033》里的景深效果
光线追踪演示DEMO
NVIDIA还宣称,GF100的游戏计算性能相比GT200有了大幅提高,比如PhysX流体DEMO演示程序3.0倍、《Dark Void》游戏物理2.1倍、光线追踪3.5倍、人工智能3.4倍。
立体多屏环绕技术3D Vision Surround
ATI Eyefinity可以支持六屏输出,而3D Vision Surround最多只能达到三屏,但它支持3D立体效果,是3D Vision技术的扩展增强版。遗憾的是,AMD Radeon HD 5000系列能单卡支持六屏输出,NVIDIA GF100却仍然只能同时驱动两台显示器,三台或者更多的话就需要两块GF100组建SLI系统。这样一来,双卡系统的性能当然会好很多,但成本也急剧增加。
但也正因为不是GF100架构的全新技术,GT200 GeForce GTX 200系列同样可以支持3D Vision Surround。事实上,NVIDIA在CES上展示的系统使用的就是两块GeForce GTX 285。
显示设备支持方面,3D立体系统需要三台同样支持3D Vision技术的液晶显示器、投影仪或者DLP,单个分辨率最高1920×1080;如果是非立体系统(此时叫作NVIDIA Surround),任何普通显示设备均可,单个分辨率最高2560×1600。
纯粹非公版!耕昇 GTX570关羽版超豪华外观设计
在介绍完GTX570乃至GF110架构的核心技术后,我们回到耕昇 GTX570关羽版显卡的介绍部分。贵为凤毛麟角的GTX570非公版一员,对于耕昇 GTX570关羽版显卡的介绍我们自然深入每一个细节来进行,与公版GTX570的对比就是其中一个重要方面。
耕昇 GTX570关羽版图片评测论坛报价
从耕昇 GTX570关羽版显卡与公版GTX570的外观对比可以看出,耕昇 GTX570关羽版显卡可谓颠覆了公版的整体设计。公版GTX570密封式的涡轮散热方案在耕昇 GTX570关羽版显卡中变成了内含三风扇外加表面散热鳍片组成的精致散热器设计。原本外露散热鳍片的设计是不太美观的,但是经过耕昇的一番工业设计后,耕昇 GTX570关羽版显卡整体观感还是十分具备个性化特征的,毕竟内含风扇设计比较有特色。
显卡表面密集的散热鳍片
多达六根散热热管
从水平观察角度可以看出,耕昇 GTX570关羽版显卡的散热器部分比双层PCI-E挡板更加凸出,使得耕昇 GTX570关羽版显卡需要占据额外2条PCI-E插槽。不过对于发烧级玩家来说,他们具备这类显卡的购买力,自然对于主板的配套也将会下较大成本的,高端大板都是他们的选择,所以这个问题不会再实际使用中起到很大的影响。
超越公版!耕昇 GTX570关羽版比公版更完美的设计
GTX570的宿敌为HD6970,同为2999元的报价。鉴于耕昇 GTX570关羽版显卡的频率与GTX570公版高一些,大家可以参考GTX570的显卡的首测,在今天的评测中我们主要进行耕昇 GTX570关羽版显卡在标频下与HD6970公版的基准性能比较。再者,耕昇 GTX570关羽版显卡的最大亮点在于静音、功耗、温度以及重中之重的超频性能。所以在以下的测试中我们着重介绍这些方面。
在平台方面我们采用了顶级的X58+Core i7 975平台来抵消整机性能对显卡性能发挥的瓶颈影响。针对千元级定位的显卡测试我们选用的测试分辨率为顶级的1920×1080 4AA与1920×1080 0AA,画质全部为高并安装了最新的A/N卡驱动。在3DMark Vantage与3DMark 11中选择X档进行测试。
3D理论性能测试:3DMark Vantage
3DMark Vantage是一款完全针对DirectX 10开发的测试软件,只提供DX10的API,因此DX9的显卡就无缘测试了,而3DMark Vantage较权威地得出显卡的DX10性能,对于消费者了解显卡的理论性能有一定的指导意义。而3DMARK Vantage提供了4个等级的标准设置,分别是Entry(入门级别),Performance(性能级别),High(高端级别)和Extreme(极致级别)。根据本次测试显卡的定位,我们选择Extreme(极致级别)对显卡进行测试。
测试画面
3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
测试模式 | Entry | Performance | High | Extreme |
显卡权重系数 | 0.75 | 0.75 | 0.85 | 0.95 |
CPU权重系数 | 0.25 | 0.25 | 0.15 | 0.05 |
3DMark Vantage 总得分标准:
3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分)
测试成绩
DX10时代的3D性能测试工具3DMark Vantage依然在DX10性能高低上具备一定的参考价值。成绩对比中,耕昇 GTX570关羽版显卡取得了绝对的领先
3D理论性能测试:3DMark 11
经过一段插曲后,3DMark 11终于在无数的目光下横空出世。顾名思义,3DMark 11最大的卖点就是使用原生DirectX 11引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DX11新特性。
3DMark 11
3DMark 11包含了演示模式与基准测试模式,演示模式包含了深海(Deep Sea)和神庙(High Temple)两大测试场景,画面效果堪比CG电影。
基准测试包含四个图形测试项目,一项物理测试和一组综合性测试,并提供了Demo演示模式。该测试程序使用了Bullet物理引擎,支持新的在线服务,并在原有英文支持的基础上,加入了德语、芬兰语以及简繁体中文的原生支持。
测试场景截图
测试成绩
3DMark 11的Extreme档测试中,耕昇 GTX570关羽版显卡的成绩与HD6970可谓平分秋色,彼此之间成绩差距可谓微乎其微。
Heaven Benchmark 2.1对比测试
游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具。
Heaven benchmark 2.1
测试界面
在2.0版本的基础上,Heaven Benchmark 2.1测试工具加入了对OpenGL 4.0标准规范的支持,包括OpenGL模式下的硬件曲面细分技术。并且加入了对多种立体3D模式的支持,包括Anaglyph、Separate Images、NVIDIA 3D Vision、iZ3D等等。此外,2.1版本还进行了一些细节方面的优化和完善。
测试成绩
Heaven Benchmark 2.1作为DX11核心特效细分曲面的标准化测试工具,参与测试的两块显卡的成绩均彼此各占据半壁江山。耕昇 GTX570关羽版显卡在0AA中测试成绩更好,不过HD6970在4AA中占据一定优势。
显卡温度功耗噪音测试
在测试之前需要说明的一点是,由于我们无法测试单张显卡的独立功耗,因此在测试中所有的功耗成绩均为整机功耗,测试频率均为默认频率。我们采用严厉的FurMark进行烤机,5分钟后记录核心满载时的温度;然后待机5分钟,在GPU-Z的Sensor功能记录此时为待机核心温度。在两个测试环境下我们都使用功耗测试仪来检测功耗,测试环境保持在空调室温25摄氏度。对比的HD6970显卡为公版。
Furmark
测试成绩
功耗方面,耕昇 GTX570关羽版显卡频率比公版高,功耗也比公版的高一些,不过整体比HD6970显卡在功耗上还是高比较多的。不过在温度方面,耕昇 GTX570关羽版显卡的温度控制比较出色,满载82摄氏度在顶级显卡中算是合理的水平,比HD6970以及公版GTX570显卡要低,要知道耕昇 GTX570关羽版显卡的频率更高。
至于在噪音方面,耕昇 GTX570关羽版显卡的三风扇散热的噪音明显比涡轮散热风扇低,更符合玩家对低噪音环境的使用需求。
耕昇 GTX570关羽版显卡超频测试
顶级显卡的超频是一个难题,公版顶级显卡的超频可谓难上加难,不过对于耕昇 GTX570关羽版显卡来说不是问题。在这次超频测试中,我们并不对耕昇 GTX570关羽版显卡进行加压等冒险操作。我们一开始保险地超频到850MHz,此时运行十分流畅。于是我们再接再厉,超频到860MHz、875MHz、最后到890MHz,此时为耕昇 GTX570关羽版显卡的极限核心频率。需要注意的是,我们将显存频率超频到固定的4000MHz。
以下是850MHz、875MHz、890MHz下的超频测试成绩截图。
850/4000MHz的测试成绩
875/4000MHz的测试成绩
890/4000MHz的测试成绩
从750到890MHz,耕昇 GTX570关羽版显卡的核心频率超频幅度在顶级显卡来说已经让人大吃一惊了,此时的频率已经超越了普通GTX460的极限超频频率。
在超频到890/4000MHz的频率下,耕昇 GTX570关羽版显卡的性能已经超越了GTX580,在3DMark 11的测试中已经大幅度超越了公版GTX570与HD6970,性能增值十分巨大。
PConline评测室总结
从耕昇 GTX570关羽版显卡的评测中我们明显感受到,该卡就是耕昇品牌转型到以品质为发展重点的里程碑。
耕昇 GTX570关羽版显卡代表着耕昇走向品质的转型
在市场上鲜有GTX570非公版显卡的现状下,耕昇抢先推出了完完全全非公版设计的GTX570显卡,不仅为顶级游戏玩家提供了差异化选择,还提升了品牌的影响力。 耕昇 GTX570关羽版显卡主要从散热、PCB设计上针对公版GTX570显卡涡轮散热设计对机箱对流环境的不适应以及公版PCB沿用GTX580的简化版等不足而进行改进。经过一番的体验,耕昇 GTX570关羽版显卡的改进是收到实在的效益的。温度更低、噪音更低,就是耕昇 GTX570关羽版显卡比公版更加优胜的地方。此外,PCB的设计也体现了耕昇一直耕耘所得到的品质上的提升,非公版设计让人感受到了顶级的做工。
耕昇 GTX570关羽版显卡优缺点点评 | |
优点 | 缺点 |
1、非公版GTX570显卡,做工设计比公版更加出色 2、噪音、散热比公版更加出色 3、超频能力极其强悍,乃顶级显卡之罕见 | 1、功耗较高 |
综合以上的改进,耕昇 GTX570关羽版显卡的超强超频能力是让我们乃至代表少数派的顶级玩家眼前一亮的地方,890/4000MHz的极限频率就是该卡强悍做工带来的超频能力的体现。更加重要的是,该卡报价为2999元,与公版GTX570保持一致。如此一来,对于发烧级玩家来说,这个决定不再艰难。