一招秒杀AMD最高端!N张GTX580暴力测试

太平洋科技
引言:上周NVIDIA抢在AMD的单核旗舰HD6970显卡前,发布了完整512个CUDA核心的单核性能王者GTX580显卡。虽然从目前的情况来看GTX580显卡再一次巩固了NVIDIA在单核显卡的绝对领先地位,但是却不得不面对单卡性能落后的局面,AMD继发布HD5970显卡之后就一直占据着最强单卡的位置,而GTX480因为过高的温度和功耗始终没能推出双芯单卡来对抗HD5970。
如今NVIDIA发布的GTX580显卡,不仅在性能上相对上一代GTX480显卡有明显提升,而且整体功耗和温度相对来说也有一定改善,在HD5970乃至AMD未来发布的HD6990显卡的双重压力下,NVIDIA很有可能推出基于两颗GTX580核心的单卡双芯显卡,来与HD5970和HD6990显卡对抗,毕竟NVIDIA不会坐视旗舰宝座位置长期在AMD手上而不管。
AMD未来的HD6990因为具体规格和设计尚不明朗,我们无法对其性能进行模拟和猜测,这种情况下AMD的单卡旗舰HD5970,在面对由两颗GF110核心所组成的火力下会有什么样的表现,而双GTX580模拟组成的未来NVIDIA双芯单卡,又能否力压对手成为新一代旗舰呢?今天我们要做的就是GTX580双重火力与HD5970双芯火力的碰撞,以及AMD目前最强大的HD5970交火性能与三张GTX580显卡互联所组成的地球最巅峰性能的暴力对抗。
本期测试显卡天梯指引位置如下:
在本期测试中,我们采用了显卡天梯图以便更直观的体现出显卡的具体性能以及对比测试显卡之间的性能高低。同时,通过这个显卡天梯图我们能一目了然的看到当前主流显卡之间的相对排位。
PConline显卡产品天梯图说明:为了让网友更直观地了解评测显卡的档次,我们引入了天梯图。在显卡天梯图中,我们按产品的性能划分产品档次,段位越高产品档次越高,性能越强。图中“红点”为该系列显卡“公版”产品所在位置。 若评测显卡高于同段位“红点”,则说明该卡的做工性能高于同系列公版产品,若低于同段位“红点”则说明做工缩水。同段位内位置越高,产品的综合实力越强。
延伸阅读:
《一个“艰难”的决定!NV新旗舰GTX580首测》
《N卡称王成过去!全球最强HD5970显卡实测》
GF110:完整版GF100核心升级版
我们都知道GTX480并非采用完整版GF100核心设计而是屏蔽了一组SM,而此前很多人都猜测在GTX480如此高的功耗和温度下,NVIDIA能否拿出完整版GF100核心显卡来。显然,这次NVIDIA推出的这款GTX580显卡就是一款基于完整版GF100核心的显卡,不过考虑到功耗和温度的影响,NVIDIA并非直接采用完整版GF100核心来设计GTX580显卡,而是在GF100核心的基础上对纹理过滤、Z轴压缩等算法上和晶体管布局上进行了一系列改进以达到更优的性能,整体而言GF110同样基于Fermi架构,并且相对于GF100来说可以称之为它的升级版。
GTX580显卡参数
GTX480显卡参数
从规格上看GTX580相对GTX480的变化并不大,除了GTX580显卡采用16组SM(480为15组480个CUDA核心)合计512个CUDA核心,频率比GTX480(700/1848MHz)高为772/2004MHz外,其它方面的参数基本一样。
下面我们简单的来了解一下这两款核心所采用的GF110核心。
GF110核心架构
完整的GF110核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存。
与GTX480一样GTX580在每一组SM阵列里包含有32个CUDA核心,每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
另外,我们都知道DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。AMD在实现细分曲面时是整个核心共用一个多形体引擎,例如上图NVIDIA也可以在GT200的基础上加上一个多形体引擎来达到变身DX11显卡。
NVIDIA这次并没有直接在GT200核心的基础上直接加入一个多形体引擎以达到DX11显卡要求,而是为了不使单一的多形体引擎成为显卡性能瓶颈在每一组SM中都加入了一个多形体引擎,这也是NVIDIA一直推迟GTX400系列显卡发布的重要原因。
HD5970显卡定位及参数介绍
HD 5970
AMD在HD5970上放弃了过往单卡双芯惯用的“x2”命名方式,HD5970采用了单PCB双RV870核心的设计,RV870核心采用了先进的40nm制造工艺,核心面积提升1.27倍的情况下,显卡核心的流处理器却提升了两倍。毫无疑问,这款显卡主要是面向高端发烧级用户。
HD5970显卡规格
HD5970 Unlocked ATI Overdrive
HD5970本身是一款定位顶级的显卡,因此AMD没有锁定Overdrive,玩家可根据自己的需要对显卡进行超频。这样可以增加显卡的可玩性。
三款显卡规格对比
我们知道HD5870内置了1600个流处理器,对比RV770内置的800个流处理器足足翻了一倍。而拥有两个RV870核心的HD5970显卡的流处理器总个数达到了惊人3200个,浮点计算能力为4.64TFLOPS、拥有2GB显存,并支持单个屏幕2560x1600分辨率下的3屏显示技术。
单PCB双核心互联
和过往单卡双核心型号显卡一样,两颗RV870核心需要通过一颗第二代PLX桥接芯片实现单卡双核心内部交火。
显卡测试平台和方法说明
正式测试之前,先让我们一起来看看与这次评测有关的相关评测平台和评测方法。
硬件平台 | |
CPU | INTEL Core i7 975 (133×25=3.33GHz 8MB L3 Cache) |
主板 | 微星 Big Bang XPower(X58) |
内存 | DDR3 1333 2GB×3 (8-8-8-24) |
硬盘 | 西部数据 WDC WD6400AAKS |
显卡 | GTX580 SLI(772/4008) GTX580 3way SLI(772/4008) HD5970(725/4000MHz) HD5970 CF(725/4000MHz) |
软件平台 | |
系统软件 | Windows 7rtm旗舰版+DirectX 11 |
驱动程序 | Force Ware262.99 orWindows 7 AMD10.10or Windows 7 |
评测软件 | DX11: Heaven banchmark 异形大战铁血战士 失落的星球2 地铁2033 战地:叛逆连2 鹰击长空2 DX10: 3DMark Vantage 温度功耗: furmark |
为了不使CPU成为显卡性能瓶颈,我们选择了目前强大的INTEL Core i7 975处理器搭配微星 Big Bang XPower主板作为测试平台。另外,考虑到Windows7系统将逐渐成为今后的主流系统,同时它还支持Direct 11因此在测试中我们所用了Windows7 64位操作系统作为测试平台,另外考虑到显卡定位等综合因素,在测试分辨率上我们选择了1920x1080 4AA、2560x1600 4AA作为测试标准。在3DMark Vantage理论性能测试中,为了能更体现出显卡的行呢个我们选择Extreme档作为测试标准。
DX10 3D理论性能测试:3DMark Vantage
3DMark Vantage是一款完全针对DirectX 10开发的测试软件,只提供DX10的API,因此DX9的显卡就无缘测试了,而3DMark Vantage较权威地得出显卡的DX10性能,对于消费者了解显卡的理论性能有一定的指导意义。而3DMARK Vantage提供了4个等级的标准设置,分别是Entry(入门级别),Performance(性能级别),High(高端级别)和Extreme(极致级别)。根据本次测试显卡的定位,我们选择Performance(性能级别)对显卡进行测试。
测试画面
3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
测试模式 | Entry | Performance | High | Extreme |
显卡权重系数 | 0.75 | 0.75 | 0.85 | 0.95 |
CPU权重系数 | 0.25 | 0.25 | 0.15 | 0.05 |
3DMark Vantage 总得分标准:
3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分)
测试成绩:
首先,我们看到双芯单卡的HD5970在这里的成绩只有一万出头,而GTX580 SLI则达到了两万多,从DX10理论性能来看GTX580 SLI的领先非常明显,同样GTX580 3way SLI对战HD5970 CF的成绩也如出一辙。
Heaven benchmark 2.1对比测试
游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具。
Heaven benchmark 2.1
测试界面
在2.0版本的基础上,Heaven Benchmark 2.1测试工具加入了对OpenGL 4.0标准规范的支持,包括OpenGL模式下的硬件曲面细分技术。并且加入了对多种立体3D模式的支持,包括Anaglyph、Separate Images、NVIDIA 3D Vision、iZ3D等等。此外,2.1版本还进行了一些细节方面的优化和完善。
测试成绩:
Heaven Benchmark 2.1曲面细分得比较细,因此它对显卡tessellation性能要求比较高,而具备16个多形体引擎的GTX580显然更具备优势。
DX11游戏《地铁2033》测试
作为一款恐怖FPS游戏,《地铁2033》拥有次世代顶级的画面表现,精确的实时光照,高精度的体积阴影,PhysX加速效果,尤其是整体大范围烟雾尘埃刻画更是出众,营造出了一个极具渲染力的恐怖末日游戏场景;游戏中,主角与其他角色的互动性较高,任务也具有一定的自由度;武器种类虽然较少,但细节表现还是较为优秀的。总体上,《地铁2033》凭借DirectX 11/10/9下的优异画面表现和超精细场景刻画,绝对是一款对游戏画面有追求的FPS玩家必玩的大作。
The Way/PhysX(点击放大)
进入《地铁2033》游戏初始界面相信玩家可以感觉到本作的独到设计风格,落在相关选项上对象会有高互动的感应。
VIDEO
DIRECTX 11 OPTIONS(DIRECTX 11选项),RESOLUTION(分辨率),DIRECTX,ANTIALIASING(抗锯齿),TEXTURE FILTERING(纹理过滤),GAMMA(伽玛值)。测试中我们将所有的特效都开到最高,同时打开游戏物理加速。
测试成绩:
《地铁2033》不仅仅是DX11游戏,而且它也是一款物理游戏,同时它对显卡的要求也几乎可以用苛刻来形容,GTX580 SLI能取得40帧以上成绩算很不错了,而HD5970则由于DX11和物理加速等双重因素,成绩落后比较明显。
DX11游戏《异形大战铁血战士》测试
《异形大战铁血战士》是这款FPS游戏是由Rebellion公司开发的,本次的游戏的剧情没有照搬电影的剧情,而是将舞台设定为名叫BG-386的行星,相同的是人类在该星球发现了古代金字塔,而围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。
异形大战铁血战士
游戏中除了提供单人故事模式以外,还提供多人对战模式,可以说多人对战模式才是这个游戏最能吸引玩家一直玩下去的地方。
纹理质量、分辨率、阴影复杂性、各向异性过滤、环境光散射,垂直同步的调整菜单。所谓的(环境光散射)Ambient Occlusion是指通过不特定的光源表现周边所有环境阴影的功能。比如在在墙和墙草和草之间相关物体们产生的光线的反射。在测试中我们将所有的特效开至最高。
测试成绩:
《异形大战铁血战士》作为AMD显卡的优势游戏,在这里还是发挥出了它的作用,我们看到HD5970 CF的成绩整体来看还是领先GTX580 3WAY SLI的。
DX11游戏《失落的星球2》评测
失落的星球2
游戏采用CAPCOM独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致美丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》,并且PC版本加入了DX11特效,成为一款具备DX11性能参考价值的游戏。本次测试,我们使用了官方的Benchmark Version进行测试,结果具备很大的权威性。
失落的星球2
测试成绩:
在《失落的星球2》中GTX580性能依旧领先对手,不过从成绩中我们看到三路GTX580 SLI的性能要略低于双路GTX580 SLI的性能,经过笔者多次测试其成绩依旧如此,这一情况可能跟《失落的星球2》对三卡的支持还不是完善有关。
DX11游戏《鹰击长空2》评测
DX11游戏《鹰击长空2》
《鹰击长空2》是最新的DX11游戏,玩家将扮演飞行员,驾驶世界上最先进的飞机,担任一系列的战斗任务。该游戏运用了较多DX11中很重要的“细分曲面”特效,能较好地反映显卡的DX11性能。我们采用Benchmark进行测试。
测试成绩:
《鹰击长空》与《Heaven benchmark》的情况比较相似,因此从测试成绩可以看到GTX580 SLI的成绩明显高于HD5970 CF。
DX11《战地:叛逆连2》游戏对比测试
《战地:叛逆连2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定 2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该作是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连》的直接续作,在继承前作特性的基础上,加强了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
设置(点击查看大图)
游戏的选项主要分为一般设置和行动设置两部分。一般选项包括了游戏控制器的选择,玩家控制的习惯,以及声音和视频的设置,多种选项堆在一个窗口虽然稍稍令人有些眼花缭乱,但是却省略了不停翻页找选项的痛苦。至于行动设置部分,则就是图中的“步行”、“载具”和“飞行”的选项。《战地:叛逆连2》提供了多达15种。
测试成绩:
在这款游戏中HD5970 CF的成绩与GTX580 SLI之间的差距有所减小,在2560x1600分辨率下甚至比GTX580 SLI更高。
显卡功耗温度测试
在测试之前需要说明的一点是,由于我们无法测试单张显卡的独立功耗,因此在测试中所有的功耗成绩均为整机功耗。
FurMark
我们采用严厉的FurMark进行烤机,5分钟后记录核心满载时的温度;然后待机5分钟,在GPU-Z的Sensor功能记录此时为待机核心温度。在两个测试环境下我们都使用功耗测试仪来检测功耗,测试环境保持在26摄氏度。
测试选项设置
测试成绩:
首先需要说明的一点是,这次GTX580的功耗测试部分我们全部都是在破解之后进行的,因此这里的功耗为GTX580满载的真实功耗。从上面的功耗测试部分可以看出GTX580功耗高的问题依然是一个比较严峻的问题。
附:GTX580显卡真实功耗测试详解
在GTX580显卡的首发文章中我们曾提到过,NVIDIA对GTX580显卡在Furmark等严酷烤机软件中进行了降频,以达到保护显卡和降低功耗的目的,虽然NVIDIA的这一做法是从保护显卡的现实角度出发的,不过却也招到了不少非议和存在作弊嫌疑。
前几天TechPowerUp网站就公布了一款特别版GPU-Z,通过这款GPU-Z做简单的处理和运行就能破解NVIDIA对GTX580显卡的限制,从而达到Furmark对其进行满载功耗测试,下面我们就通过这个方法对GTX580进行了在破解钱和破解后的功耗对比测试。
要想破解NVIDIA的限制,我们只要在运行中加入参数"/GTX580OCP",或在GPU-Z软件的快捷方式中输入 /GTX580OCP(如图),即可破解显卡功耗限制。
GTX580破解之前显卡功耗(整机)
为了体现出了破解前面GTX580显卡功耗区别,我们在这里做了关于显卡功耗的评测。从上面的测试情况来看未破解前在I7 975平台下的GTX580整机功耗为324W。
GTX580破解之后显卡功耗(整机)
运用特别版GPU-Z破解之后,我们再用Furmark进行烤机测试从上面的测试结果中看到,破解之后的GTX580的整机功耗达到了446W,整整上升了了达120W。
GTX580特别版GPU-Z下载:附件
PConline评测室总结
在这次对比评测中,我们之所以没有选择DX10和DX9游戏作为测试项目,一方面是无论HD5970还是GTX580作为最新发布的显卡两者都能较好地支持DX11,因此在测试游戏和项目上也就不存在公平问题,另一方面是无论是现在还是将来DX11游戏将会越来越多并逐渐取代DX10游戏成为主流,这一点是非常明确的。
GTX580 SLI与HD5970的DX11性能比较 | ||||
项目/GPU | GTX580 SLI | HD5970 | GTX580 SLI VS HD5970 | |
Heaven 2.1(1920x10804AA) |
78.6 | 43.7 | ↑ 80% | |
Heaven 2.1(2560x16004AA) |
52.1 | 26 | ↑ 100% | |
鹰击长空2(1920x10804AA) | 187 | 100 | ↑151% | |
鹰击长空2(2560x16004AA) | 176 | 70 | ↑ 151% | |
失落的星球2(1920x10804AA) | 64.1 | 40.7 | ↑ 57% | |
失落的星球2(2560x16004AA) | 56 | 30.9 | ↑ 81% | |
地铁2033(1920x10804AA) | 45.7 | 23 | ↑99% | |
地铁2033(2560x16004AA) | 23 | 18 | ↑ 28% | |
A.V.P(1920x10804AA) | 85.9 | 53.9 | ↑ 59% | |
A.V.P(2560x16004AA) | 51.3 | 31 | ↑ 65% | |
战地:叛逆连2(1920x10804AA) | 115.2 | 100.6 | ↑ 15% | |
战地:叛逆连2(2560x16004AA) | 105.4 | 89.4 | ↑ 18% | |
平均 | ↑ 75% |
我们不得不承认GTX580 SLI的性能相对于HD5970来说要好非常多,而出现这种情况也是在我们的情理和意料之中的事情。首先,从我们的GTX580首发文章《一个“艰难”的决定!NV新旗舰GTX580首测》中不难看出GTX580显卡相对HD5870显卡其性能领先幅度是非常明显的,而HD5970显卡虽然采用的是两颗HD5870显卡核心,不过却在频率上要明显低于HD5870,这也就是说HD5870 CF的性能是要领先HD5970的,由此可见两张GTX580领先HD5970 CF也就不足为奇了。
当然,除了GTX580本身的性能要比HD5870好以外,GTX580在双卡互联的性能提升上比对手要好也是重要的原因。但是在性能领先的情况下,我们也看到GTX580 SLI的实际功耗还是非常高的,它甚至比HD5970 CF的功耗还高,就算在未来的双芯显卡上NVIDIA同样做出限制,其功耗依然要比对手高不少,这一点是不能否认的。
GTX580 3way SLI与HD5970 CF的DX11性能比较 | ||||
项目/GPU | GTX580 3way SLI | HD5970 CF | GTX580 3way SLI VS HD5970 CF | |
Heaven 2.1(1920x10804AA) |
99.7 | 82.4 | ↑ 21% | |
Heaven 2.1(2560x16004AA) |
69.5 | 53 | ↑ 31% | |
鹰击长空2(1920x10804AA) | 194 | 113 | ↑ 72% | |
鹰击长空2(2560x16004AA) | 181 | 111 | ↑ 63% | |
失落的星球2(1920x10804AA) | 62.7 | 57.6 | ↑9% | |
失落的星球2(2560x16004AA) | 54.5 | 51.7 | ↑ 5% | |
地铁2033(1920x10804AA) | 54.8 | 28 | ↑ 96% | |
地铁2033(2560x16004AA) | 29 | 22 | ↑ 32% | |
A.V.P(1920x10804AA) | 114.3 | 56.3 | ↑ 103% | |
A.V.P(2560x16004AA) | 71 | 31.9 | ↑ 123% | |
战地:叛逆连2(1920x10804AA) | 120.1 | 114.1 | ↑ 5% | |
战地:叛逆连2(2560x16004AA) | 110 | 111.7 | ↓ 2% | |
平均 | ↑ 47% |
与GTX580 SLI相比HD5970大幅领先的情况有所不同,在GTX580 3way SLI与HD5970 CF的对比测试中,我们看到GTX580 3way SLI的领先幅度有一定的回落。毕竟三张GTX580组合在一起也不过只是三颗核心,而HD5970 CF两张卡共有四颗核心,出现性能回落也就不足为奇了。不过三芯打败四芯的情况,一方面是AMD双卡组合的效能确实还有待提高,而最重要的原因依然是AMD显卡在DX11游戏中的本来弱势,AMD想要在未来DX11游戏中站稳脚跟重新设计适合DX11的显卡架构显得很有必要。