新浪科技

只比拼DX11性能 HD5800全面对比GTX400

中关村在线

关注

作者:中关村在线 林光楠


第1页:该出手了!市售高端DX11显卡集合
前言:DirectX 11从微软正式发布至今已有半年多时日,随着AMD率先与Windows 7系统同步上市,随着NVIDIA在今年3月末终于推出相关硬件产品,随着游戏厂商大量推出DirectX 11游戏后,DirectX 11宣告正式走进我们大众用户生活。

    那么你现在拥有一块DirectX 11显卡吗?如果你正在使用DirectX 11显卡,你在实际应用中应用到DirectX 11 API了吗?玩DirectX 11游戏了吗?无论你是否拥有、无论你是否曾经体验,本文将搜罗目前能搜集到的DirectX 11应用,尤其是用户关心的游戏应用本文将会详细测试。


    用户接触的第一款DirectX 11游戏应该是《潜行者:普里皮亚召唤》,但它的出现并没有在广大游戏玩家中得到轰动效应,不过它却给了DirectX 11产品评测的依据。随后,AMD与CodeMaster游戏公司合作推出《科林麦克雷:尘埃II》,在游戏玩家和硬件爱好者中引起了轰动。当时市场中还仅有AMD一家提供DirectX 11显卡,这款游戏的出现让本已火爆销售的Radeon HD 5000系列显卡,销量更上一层楼。

    AMD的一枝独秀,让Radeon HD 5000系列在用户认知度、市场占有率上占尽先机,反观NVIDIA则困扰在全面革新的Fermi架构图形核心良率问题上。我们知道,市场良性竞争才会给用户带来更多的优惠,在全球用户期盼半年后NVIDIA终于推出了GeForce GTX 400系列,不过强大的性能优势和高功耗的弊端让其成为了不可调和的矛盾体。


     AMD在DirectX 11产品线上布局迅速,率先完成整套中高低端的产品布局,同时还是抢在对手NVIDIA发布DirectX 11产品之前完成。不过NVIDIA CEO黄仁勋先生曾说过:“早出的不一定最好,我们只造最好的”,GeForce GTX 400系列一经发布,其顶级型号确实完成最强单图形核心最强的任务。

    现在,用户可以根据自己的品牌喜好、性能强度以及价格定位,选择自己心目中的DirectX 11产品。不过如果你想要体验真正的DirectX 11效果、如果你想体验流畅的DirectX 11高画质,也只有使用AMD和NVIDIA高端产品才能实现,也就是Radeon HD 5900、Radeon HD 5800及GeForce GTX 400系列。

    如果你是一名对DIY钟情的用户,肯定不会对上述顶级显卡及规格陌生,不过俗话说的好“温故而知新”,下面我们还是列出了它们的详细规格:

    通过上面的规格对比,我们发现无论AMD还是NVIDIA,在各自第一代DirectX 11产品上都有一些共性,下面我们总结一下:

①图形核心处理器均采用40nm工艺。它的采用,有效解决了超高集成度晶体管在低制程下高功耗、高发热量的问题,同时如果能保证良率,其产品本身成本也会大幅降低。

②晶体管数量均超过20亿。高端系列拥有高标规格这是必然的,如果要完成高规格就需要更多的晶体管来搭建。RV870成为首个突破20亿晶体管的图形处理器,而半年后GF100打破RV870记录,使用30亿晶体管。

③均标配GDDR5显存。GDDR5显存的高频率、低电压、低功耗是它的特色,所以高端系列产品标配其成为性能发挥的利器。同时高频带来的高带宽也非常明显,我们看到上表中A/N的所有高端系列产品显存带宽无一例外的超过100 GB/s。

④内存容量1GB成为起步。AMD的Radeon HD 5000系列公版产品除了最低端的几款产品上均以1GB为标配,而NVIDIA方面由于DirectX 11产品仅发布两款,但都超过1GB标准。大显存容量对数据吞吐,尤其是纹理贴图等方面会带来很大改善。

⑤注重GPU通用计算。在图形处理器采用统一架构设计后,图形处理器的通用计算潜力被深挖,尤其是在DirectX 11加入Direct Compute和OpenCL的诞生,这一代无论AMD还是NVIDIA产品都无一例外的加强了通用计算能力。

2ba3
第2页:温故而知新 1600SPs高标RV870

温故而知新 1600SPs高标RV870

    ● 1600SPs核心亮相 核心面积并不大

    AMD的RV870流处理器数量可谓大幅激增,相对上一代RV770/RV790的800SPs有了翻倍设计,同时21.5亿的晶体管数量也相对有了2.2倍以上的增加,我们知道基于55nm工艺的RV770核心面积为260mm2,如果想使用55nm工艺制造RV870核心,这几乎是一项可以实现但不切实际的做法,接近600mm2的核心面积成本不菲。Radeon HD 4770的40nm核心——RV740为RV870奠定了量产基础,从而解决了RV870在工艺及成本上的问题。



40nm工艺RV870核心

    Radeon HD 5870搭载的RV870核心由台积电(TSMC)采用40nm工艺生产,其拥有1600个流处理器、32个光栅处理器和80个纹理单元。此次AMD的产品线升级,最重要的就是完美支持DirectX 11 API和Shader Model 5.0,而且值得一提的是DirectX 11 API中新加入了Direct Compute Shader,这也是微软在GPU通用计算上的一次大踏步跃进,而且这也证明GPU未来在通用计算领域的重要性。


21.5亿晶体管 核心面积仅为330mm2

    前文我们说过RV870如果不采用全新的40nm工艺制造,将会带来高成本、高功耗、高发热量的诸多弊端,而采用40nm工艺后可以说药到病除,问题迎刃而解。

    RV870相对RV770在增加了2.2倍以上晶体管数量的前提下,核心面积仅增加了不到27%,即从RV770的260mm2仅增加到330mm2。RV870核心为正方形设计,我们使用电子游标卡尺实际测量边长约为18.92mm,与实际的18.17mm有测量误差。


RV870核心架构


RV770核心架构

    对比RV870和RV770核心架构我们发现,RV870并非RV770一样将1600个流处理器设计在同一区域,而是将1600个流处理器分为2组各800。

    我们知道统一架构能够更加合理的利用每一个流处理器(Stream Processor),而且每个流处理器均能服务于顶点、像素、几何乃至DirectX 11引入的Direct Compute Shader,这种通用性可以充分利用GPU的并行架构。

    在从AMD第一代统一架构图形芯片出世以来,均是采用SIMD设计,与以往不同的是RV870的SMID Cores被分为两部分。这样的设计更有理由图形核心的设计以及产品良率的提高,但这样的弊端就是需要对核心内部的线程控制器及驱动仲裁机制提出了严峻挑战。

    首先核心需要一个叫做“Ultra-Threaded Dispatch Processor”(超级线程控制器)来整体分配流处理器处理,然后交由两组的流处理器进行计算,最后交由ROP(光栅处理器)最后进行AA(反锯齿)处理,同时在“Global Data Share”中的纹理贴图直接进入L2 Cache。最终在每组内存控制器的作用下,将ROP和L2 Cache的数据汇总输出。


    本章节文字源于《摧垮上代GPU AMD首款DX11显卡5870测试


第3页:30亿晶体管怪兽 全新颠覆架构GF100

30亿晶体管怪兽 全新颠覆性架构GF100

    ● 言归正传 了解Fermi架构GF100图形核心

    我们知道全规格Fermi架构产品拥有512 CUDA Cores,而作为顶级的单芯产品GeForce GTX 480并没有标配全规格图形处理核心,而是缩减了1组SM后得到核心,这是让笔者和众多消费者没有想到的。不过笔者分析,GeForce GTX 480标配非全规格图形核心的原因主要有三:其一、该核心足以满足用户需求,同时能够镇压竞争对手顶级产品;其二、处于功耗以及成本方面的综合考虑;其三、提高GF100图形核心良率。当然这些仅是笔者个人猜测,不代表本站和NVIDIA官方意见,但无论怎样GeForce GTX 480的发布确实对图形核心发展有着重要的意义。



基于40nm工艺的GF100-375-A3核心

    GeForce GTX 480标配的GF100-375-A3核心是由台积电(TSMC)采用40nm工艺制造,其共有32亿晶体管,是目前最庞大的图形处理核心。用于GeForce GTX 480的GF100核心拥有480个流处理器、60个纹理单元、48个光栅处理器,同时标配384bit显存控制器。

    Fermi架构的GF100芯片相对于早期G80架构(G80架构影响了G8X、G9X和G200架构设计),除了常规的流处理器数量等参数升级外,Fermi架构相对G80架构做了重大调整,例如在Cache、SM架构等等方面做了改革,目的是让GF100核心适应现在甚至未来的用户应用需求。例如,Fermi架构图形核心引入了真正可读写L1/L2缓存,新增了Polymorph Engines和Raster Engines引擎等。

Fermi架构GF100核心 新增强劲神器引擎

    当然仅是在数量优化上做改变还不能称为第二代CUDA架构,我们在GF100核心架构图和SM架构图上可以看到,相比G80/92和GT200核心架构多了Polymorph Engines和Raster Engines功能模块组。那么它们又是做什么的呢?


全新的Polymorph Engines和Raster Engines

     我们可以这样简单的理解,在数据处理流程中的一些功能模块现组成了现在的Polymorph Engines和Raster Engines。其中Polymorph Engines包括Vertex Fetch、Tessllator、Viewport Transform、Attribute Setup和Stream Output,Raster Engines包括Edge Setup、Raterize和Z-Cull。


GF100对比RV870 Tessellation性能

    值得一提的是DirectX 11中Tessellation功能是必不可缺的,而Tessellator并不是使用SP来完成,而是采用独立功能模块完成,在这一点上与AMD的做法一致。但不同的是,AMD的Tessellator采用串行计算模式,也就是说核心中只有一个Tessellator功能模块,数据计算从分配到接收Tessellator会成为瓶颈。反观NVIDIA的GF100核心,每组SM拥有一个Polymorph Engines,这也就意味着一个GF100核心拥有16个Tessellator功能模块,在Tessellation多数据并行计算方面GF100遥遥领先RV870。


Polymorph Engines和Raster Engines在GF100中的设计

    前文提过每组SM都会标配一个Polymorph Engines,同时每组GPC将独立拥有一个Raster Engines,这样的设计都是增加各种数据计算的并行效果,相比RV870的非Shader计算串行设计要优越很多。

    Fermi具备的光栅并行化是一个重要创新。NVIDIA称Fermi GF100是一个全新架构,不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(Raster Engine)和多形体引擎(PolyMorph Engine)。


光栅引擎(Raster Engine)

    光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。


多形体引擎(PolyMorph Engine)

    多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。Fermi GF100产品中有16个多形体引擎,每个SM一个,或者说每个GPC拥有四个。

    凭借多形体PolyMorph引擎,Fermi实现了全球首款可扩展几何学流水线,该流水线在单颗GPU中包含了最多16个Tessellation引擎。这些引擎在DirectX 11最重要的全新图形特性GPU加速Tessellation中能够发挥出革命性的性能。通过将更加细腻的几何图形融入到场景当中,Tessellation让开发人员能够打造出视觉清晰度极高、更加复杂的环境。锯齿边缘平滑了,从而使游戏中所渲染出来的人物能够拥有影院般细腻的画质。

    在以前的架构中,固定功能单元只是单一的一条流水线。而在GF100,无论是固定功能单元和可编程操作单元都并行设计,这大大提高图形性能,也解决了GPU长期以来未有重大突破的性能短板。

    多形体PolyMorph引擎的出现,是几何流水线近几年间不断演化的重大突破。特别是细分曲面操作,需要的三角形和光栅能力都异常可怕,传统GPU无法应对。多边形引擎的出现大幅度提高了三角形、细分曲面和流输出能力。通过给每个SM搭载属于自己的细分曲面Tessellation硬件单元,并为每个GPC搭载属于自己的光栅化引擎,GF100最终为我们提供了高达8倍于GT200几何性能。


    本章节文字源于《领先A卡强项达50% 卡皇GTX480全球首测

5a5f
第4页:用的明白!探索DX11游戏画质提升根本

用的明白!探索DX11游戏画质提升根本

DX11什么功能带来更细腻画质?

    每一代DirectX API的升级或者游戏引擎的升级都会带来游戏画质提升,而其中DirectX API的升级会具有更广的应用性。而在DirectX 11 API上除了前文介绍的HDAO技术外,我们还应该了解另外两个技术,它们分别是Tessellation和Order-Independent Transparency,中文字面意译就是镶嵌细面曲分技术和顺序无关半透明技术。

    那么二者又有何作用呢?

    ● Tessellation镶嵌细面曲分技术

    我们知道,3D渲染简单来说就是一个建立三角形的过程,三角形越多越小渲染出来的结果就会越细致,人眼识别起来就更真实。不过在现有人力和硬件资源上,并不能为了获得更细致的画面而过分损耗编程人员和硬件资源,所以一种能够自动处理并且相对以前硬件架构有质的改变才能有效实现更高画质的梦想。



Tessellation带来更细腻的画质

    Tessellation就这样应运而生,首先图形核心架构从原来像素、顶点等Shader转变为统一架构的流处理器,这样就能够最大化应用图形核心的并行计算能力优势;而Tessellation能够在编程人员仅勾勒出简单轮廓后,自动镶嵌细化三角形模型。上图就能让我们最直观的感受Tessellation的优势。

    下面我们就以目前仅有的DirectX 11 API测试软件《Heaven Benchmark》截图为例,视觉区别一下启用Tessellation的画质提升。


《Heaven Benchimark》开启Tessellation


《Heaven Benchimark》关闭Tessellation

    上面两副图中,也许缩略图不能一下分别出差距,笔者建议点击放大后观察较为容易。其实如果仔细看,龙的身体和房屋的瓦片开启Tessellation前后差距最为明显。


《Heaven Benchimark》开启Tessellation


《Heaven Benchimark》关闭Tessellation

    上面两副图的效果差异非常明显,石路和石桥上的石块凹凸感明显是在开启Tessellation后更具立体感。

    DirectX 11提供的Tessellator单元本身不具备可编程性,因此DirectX11向Tessellator单元输入或者从中输出的过程是通过两个传统的管线阶段完成的:Hull Shader (HS,外壳着色器)和Domain Shader (DS,域着色器)。

    Hull Shader负责接收琐碎的图形数据和资料,而control points将会基于如何配置Tessellator来产生数据。可以说,Tessellator就是一个固定功能模块,用来处理一些基于一定参数的输入数据。最后Domain Shader将会接收由Tessellator产生出的点,并依照终点控制(control points)置换贴图将这些点形成一个合适的几何图形。

    ● 什么是HDAO?和SSAO有何关系?

    在HDAO和SSAO中,"AO"为Amblent Occlusionde的缩写,中文译为环境光遮蔽。在DirectX 10.1 API推出后,Amblent Occlusionde升级为SSAO;而在微软推出DirectX 11 API后,SSAO升级至HDAO。

    其实现有采用统一架构的图形核心都能实现环境光遮蔽效果,仅是SSAO在DirectX 10.1引入后,得到了更优的代码/函数能够更有效的实现环境光遮蔽效果,例如支持DirectX 10.1的图形核心和仅支持DirectX 10的图形核心在处理同一画面,前者较后者有10%以上的效能提升。而DirectX 11引入的HDAO,相较SSAO和AO又有了效能提升。了解了AO、SSAO、HDAO之间的关系后,让我们看一下实际有效效果。


1:1细节对比(每组对比 左侧为AO开启 右侧为AO关闭)

    首先,也许很多网友对比完图片后感觉并没有明显区别,笔者需要提醒大家本页图片最好点击放大后对比;其次,也许很多网友点击放大后确实发现了区别,不过还会有很多反对的声音,例如“升级显卡为了这么一点提升不值”,但是笔者需要说的是每一代产品、每一代API的升级画质都是一个循序渐进的过程,这种积少成多的画质量变才能引起画质的质变。


    本章节文字源于《领先A卡强项达50% 卡皇GTX480全球首测


第5页:性能测试的硬件、软件平台状况

性能测试的硬件、软件平台状况

● 测试系统硬件环境

性能测试使用的硬件平台由Intel Core i7-975 Extreme Edition、ASUS P6T Deluxe主板和2GB*3三通道DDR3-1600内存构成。细节及软件 环境设定见下表:


测 试 平 台 硬 件
中央处理器Intel Core i7-975 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存
散热器Thermalright Ultra-120 eXtreme
单个120mm*25mm风扇 / 1600RPM)
内存模组G.SKILL F3-12800CL9T-6GBNQ 2GB*3
(SPD:1600 9-9-9-24-2T)
主板ASUS P6T Deluxe
(Intel X58 + ICH10R Chipset)
显示卡
AMD 产 品
Radeon HD 5970
(RV870 / 2048MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
Radeon HD 5870
(RV870 / 1024MB / 核心:850MHz / Shader:850MHz / 显存:4800MHz)
Radeon HD 5850
(RV870 / 1024MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
Radeon HD 5830
(RV870 / 1024MB / 核心:800MHz / Shader:800MHz / 显存:4000MHz)
NVIDIA 产 品
GeForce GTX 480
(GF100 / 1536MB / 核心:700MHz / Shader:1401MHz / 显存:3696MHz)
GeForce GTX 470
(GF100 / 1280MB / 核心:607MHz / Shader:1215MHz / 显存:3348MHz)
硬盘Hitachi 1T
(1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区)
电源供应器AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)



G.SKILL F3-12800CL9T-6GBNQ


AcBel R8 ATX-700CA-AB8FB


Thermalright Ultra-120 eXtreme

我们的硬件评测使用的内存模组、电源供应器、CPU散热器均由COOLIFE玩家国度俱乐部提供,COOLIFE玩家国度俱乐部是华硕(ASUS)玩家国度官方店、英特尔(Intel)至尊地带旗舰店和芝奇(G.SKILL)北京旗舰店,同时也是康舒(AcBel)和利民(Thermalright)的北京总代理。

● 测试系统的软件环境

操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动
Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.3b)
NVIDIA Forceware for Win7
(WHQL / 版本号 197.41)

桌面环境

2560*1600_32bit 60Hz

测 试 平 台 软 件
3D合成
测试软件
3Dmark Vantage
Futuremark / 版本号1.01
3D游戏
测试项目
DirectX 11
Benchmark
Heaven Benchmark
UNIGINE / 版本号 1.0
Heaven Benchmark
UNIGINE / 版本号 2.0
DirectX 11游戏Alien vs. Predator
SEGA / 版本号 1.0
Battlefield:Bad Company 2
EA / 版本号 1.0
Colin McRae DiRT 2
Codemasters / 版本号 1.01
Motre 2033
4A Game / 版本号 1.0
S.T.A.L.K.E.R.:Call of Pripyat
Koch / 版本号 1.0
Stone Giant
BitSuid / 版本号 Beta
微软DirectX 11 SDK—Sub 11
微软 / 版本号 SDK
GPU通用计算ComputeMark
 / 版本号 1.1
DirectCompute Bencmark
Copcom / 版本号0.35 & 0.45
辅助测试软件Fraps
beepa / 版本号 3.1.3

各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。

202a
第6页:DX11游戏-异形大战铁血战士

    ● Aliens Vs. Predator

由Rebellion开发、世嘉发行的科幻射击游戏《异形VS铁血战士》(Aliens vs. Predator)现已确定发售日期。根据世嘉的《异形VS铁血战士》官方网页的信息,本作将于2010年2月19日上市,对应PC、PS3和Xbox 360平台。这部根据电影改编的游戏也同样存在着三方势力,一方是人类海军陆战队,一方是异形,还有一方是铁血战士,游戏中玩家可以选择的是海军陆战队或者是铁血战士甚至是异形。本作提供单人模式和多人模式。


>>游戏类型:DirectX11第一人称射击类游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

    在《异形大战铁血战士》这款DirectX 11游戏中,Radeon HD 5000系列伴随着催化剂10.3驱动性能表现十分出色,Radeon HD 5870与GeForce GTX 480相抗衡,同时有微弱领先优势。而Radeon HD 5970凭借多核心优势,大幅领先其他所有产品。

    在测试过程中,在相同画质设置下,笔者感觉到使用Radeon HD 5000系列表现出的动态模糊效果更多。


第7页:DX11游戏-叛逆连队2

    ● Battlefield: Bad Company 2

《战地:叛逆连队2 (Battlefield: Bad Company 2) 》是EA DICE研发的第9款“战地”系列作品。它是2008年上市的同系列的游戏战地:叛逆连队的续作。两在单人游戏剧情上亦有很多交叉点。游戏仍然沿用前作的寒霜引擎,并有所改进。除了完善了代码的优化,本作在破坏效果上也有所加强,可破坏的物件由92%上升到99%。前作里不能破坏的小物件以及建筑物框架,在本作中也可以被破坏。


>>游戏类型:DirectX11第一人称射击类游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

    在《叛逆连队2》游戏测试中,GeForce GTX 480以微弱优势领先Radeon HD 5870,这主要在开启反锯齿特效时。GeForce GTX 480凭借Fermi架构的ROP端优化,反锯齿性能损失较低,而且其能够支持32x CSAA,这是目前Radeon HD 5000无法实现的。当然在整个测试中,性能表现最强的还是拥有双核心的Radeon HD 5970。


第8页:DX11游戏-科林麦克雷之尘埃2

    ● Colin McRae DiRT2

   《科林麦克雷:尘埃》本身是一款为纪念去世的英国拉力赛车手科林.麦克雷(Colin McRae)而制作的游戏,因此在游戏过程中不难见到许多麦克雷过往的身影,距前作将近二年多之久的《科林麦克雷:尘埃2》于2009月12月11日正式发售。值得一提的是,这款游戏不仅拥有很高的可玩性,同时还是率先支持DirectX 11 API的游戏,一经上市就得到广大游戏爱好者争相追捧。


>>游戏类型:DirectX 11竞速类游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的赛车过场回放
>>画质设定:全部最高

    我们知道《科林麦克雷;尘埃II》这款游戏是AMD和CodeMaster联袂打造的DirectX 11大作,不过在实际测试中GeForce GTX 480以极微弱性能优势领先Radeon HD 5870,不过就整体而言是保持在一个水平线上。值得一提的是,Catalyst 10.3驱动释放了Radeon HD 5000系列在该游戏上的性能,即使Radeon HD 5830也能流畅运行在2560*1600 8X AA / 16X AF画质下。

2594
第9页:DX11游戏-地铁2033

    ● Metro 2033

    本作题材基于俄罗斯最畅销小说Dmitry Glukhovsky。由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,世界被一次灾难性事件毁灭,几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里,人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。


>>游戏类型:DirectX11 第一人称视角射击游戏
>>测试方式: 软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

    《地铁2033》是首款DirectX 11加PhysX的组合游戏,游戏整体画面效果及画质非常好,但是对显卡要求同时也非常高。在实际测试数据上1920*1200 NA AA / NA AF画质下,只有顶级型号的单双核产品勉强通过,在2560*1600 NA AA / NA AF画质下全军覆没。


第10页:DX11游戏-潜行者之普里皮亚召唤

   ● S.T.A.L.K.E.R.: Call of Prypiat

作为第二款支持DX11技术的游戏,《S.T.A.L.K.E.R.: Call of Prypiat》(潜行者:普里皮亚季的召唤)已于2009年11月中在德国、奥地利、瑞士三个国家先行上市销售,明年第一季度再登陆北美、英国和其他欧洲国家。该游戏此番发行了两个版本,一是普通的标准版,然后就是限量收藏版了,采用金属包装盒里,里边除了游戏本身还有一张A3地图,以及相关主题的打火机、徽章、头巾等小礼物。


>>游戏类型:DirectX11 第一人称视角射击游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

    在第一款DirectX 11游戏《潜行者:普里皮亚召唤》测试中,性能表现最佳的自然还是双核产品Radeon HD 5970,其无愧最强单卡的称号。在单核心产品中,GeForce GTX 480领先于Radeon HD 5870,尤其是在开启反锯齿特效后。


第11页:Tessellation测试-Stone Giant

    ● Stone Giant

    《Stone Giant》是一个针对DirectX 11 Tessellation效能十分依赖的Demo,本次GeForce GTX 400系列发布,笔者将用其作为检验产品Tessellation性能的工具。本环节笔者仅使用NVIDIA和AMD两家的顶级单GPU产品GeForce GTX 480和Radeon HD 5870进行对比。


>>游戏类型:DirectX11 游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

    《Stone Giant》Demo是对显卡的Tessellation性能要求较高的项目,我们可以看到在Tessellation开启式GeForce GTX 480凭借16个Tessellator的优势大幅领先Radeon HD 5000系列,即使是双核心Radeon HD 5970。


第12页:Tessellation测试-Sub 11

    ● Sub11

     Sub11是微软官方DirectX 11 SDK包中的测试软件,它能够充分体验Tessellation带来的画面效果,同时也对显卡的Tessellation进行简测。由于是微软公布的SDK测试包中软件,所以其能功能的显示图形核心的Tessellation性能。


>>游戏类型:DirectX11 Demo
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

    《Sub 11》是微软DirectX 11 SDK中的一个测试Demo,它能较公正的体现显卡的Tessellation方面性能。从实际数据来看,NVIDIA Fermi架构的多路Tessellator设计要比单路设计的Radeon HD 5000系列快很多。


第13页:DX11测试-Heaven Benchmark 1.0

    ● Heaven Benchmark 1.0

    《Heaven Benchmark 1.0》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过23个场景的测试最终得出显卡的实际效能。


>>游戏类型:DirectX 9/10/11及OpenGL Benchmark
>>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

    《Heaven Benchmark 1.0》是第一款DirectX 11测试Benchmark。从实际测试数据上不难看出,最强单卡是Radeon HD 5970,而最强单核心产品为GeForce GTX 480。

2574
第14页:DX11测试-Heaven Benchmark 2.0

    ● Heaven Benchmark 2.0

    《Heaven Benchmark 2.0》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。


>>游戏类型:DirectX 9/10/11及OpenGL Benchmark
>>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

    《Heaven Benchmark 2.0》继上一版本后做了多出修正,增加了Tessellation的测试负载度以及测试平衡性。从结果上我们看到最强单卡是GeForce GTX 480,它甚至延至了Radeon HD 5970双核心产品,Fermi架构的优势显示一览无遗。


第15页:GPU通用计算-ComputeMark 1.1

    ● ComputeMark

ComputeMark由捷克硬件和游戏网站CzechGamer.com的Robert Varga开发制作,引擎是基于Jan Vlietinck的Fluid3D Demo。软件能够使显卡占用率达到99%,而CPU占用率仅0-1%,避免由CPU性能造成对测试成绩的影响。同时该软件还有功耗测量的功能,测试时间可以随意设定。ComputeMark需要在纯DX11环境下运行,包括Windows 7 32/64位操作系统、DX11 API和DX11显卡。


    该款软件的测试结果仅供参考,从数据上不难看出ComputeMark 1.1版本还不能真正简测一颗核心的真实通用计算能力。目前该款软件已经推出1.2版本,本站会在后续测试中更新测试数据。

    DirectCompute Benchmark是第一款针对图形核心通用计算能力设计的测试软件,其能够针对DirectX API(10、10.1和11)的DirectX Compute Shader、OpenCL以及CPU进行详细测试。


第16页:GPU通用计算-DirectCompute Benchmark


    在DirectCompute Benchmark测试中,笔者仅针对软件的DirectCompute 5.0进行测试。OpenCL性能由于目前AMD还未将Stream.dll加入到WHQL驱动中,所以不做测试。

    在实际测试中,GeForce GTX 480无法运行在0.35版本,而Radeon HD 5000在0.45b版本上测试数据有问题(不排除笔者系统有问题),所以上面图标的数据是GeForce GTX 480运行在0.45b版本下和Radeon HD 5000运行在0.35版本下的成绩对比。不过该数据仅供参考,不能直接对比A/N产品性能。 


第17页:GPU底层计算-3Dmark Vantage

        ● 3Dmark Vantage

3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。


    本环节的3Dmark Vantage测试并没有采用以前的对比软件测试总成绩,而是选择了6个子项的底层数据测试,虽然这些测试是基于DirectX 10,不过在没有DirectX 11相关测试前,这些测试还是能够体现出各个产品在专项功能的强弱。

    从实际数据不难看出GeForce GTX 400系列在GPU Particles和GPU Cloth上优势明显,而Radeon HD 5000在Pom和Texture Fill上优势明显。

   上面的数据说明,A/N产品各有绝活,不能简单从某一个功能上就划分产性能档次。


第18页:DX11显卡星球大战 即将开启

    本文搜集了目前时下几乎所有的DirectX 11相关应用,通过前面的应用性测试,我们能够看到当前已经发布的AMD和NVIDIA顶级系列性能表现如何,同时也让所有用户了解到,想玩转DirectX 11游戏自己需要什么档次的显卡。

   在现有的几款DirectX 11游戏实际应用上,虽然GeForce GTX 480整体领先Radeon HD 5870,但是领先幅度有限,而且真正最强的DirectX 11单卡为Radeon HD 5970。不过在DirectX 11理论性能测试中,Fermi架构的GeForce GTX 400系列表现抢眼,甚至在一些项目上秒杀Radeon HD 5970,这也就是说以后随着游戏厂商对DirectX 11 API应用的更佳深入,GeForce GTX 400系列的性能才会得以真正体现。而在目前看来,GeForce GTX 400和Radeon HD 5000平分秋色(前者性能略强,后者架构略优)。

    那么现在和不久的将来一段时间内,DirectX 11显卡市场会有何动向呢?

    ● DirectX 11显卡现状

    目前市场中只有AMD的中高低端DirectX 11显卡产品,其产品线从399元一直延伸至4000元,丰富的产品线可以满足用户各个价位上的需求。虽然目前DirectX 10和DirectX 11显卡市场均有售,但是在同样价位上选择功能更多的产品才是上上策,例如AMD的DirectX 11产品。

    反观NVIDIA方面,虽然已经发布了DirectX 11相关产品,但仅为两款最顶级型号GeForce GTX 480和GeForce GTX 470,二者的市场零售均价为3888元和2888元。上述二者的性能不言而喻,但并非主流级用户所能触及,不过对于高端玩家来说二者不乏是一个不错的选择,毕竟NVIDIA的PhysX、CUDA 2.0等非常吸引人。当然,GeForce GTX 400系列的高温、高功耗诟病让人烦恼,不过笔者认为,虽然二者确实有上述毛病,但是购买它们的用户都为高端用户,自然已经考虑到功耗及温度方面因素,所以对于高端用户而言这并非阻碍其购买的因素,倒是供不应求的市场反响,是最大购买困难所在。

    综上所述对于目前市场来说高端市场选择余地较大,毕竟AMD和NVIDIA均推出了相关产品,而向下延伸的千元以及入门级产品仅有AMD产品可选。而且值得一提的是,GeForce GTX 400系列出现并没有真正对Radeon HD 5000系列造成价格压力,所以Radeon HD 5000系列价格将会在近期保持坚挺,如果有想购买DirectX 11产品的用户,现在是一个不错时机。



站在显卡这个十字路口,你想好买谁了吗?

    ● DirectX 11显卡不久将来

    NVIDIA方面已经确定在今年6月推出基于GF104核心的中低阶产品,这意味着NVIDIA将会在6月份开始布线整条DirectX 11产品线的攻势。值得一提的是,GF104为原生Fermi架构产品,并非GF100核心的深度缩减规格产品,所以其能够在功耗、温度及价格上确保最佳的性价比。同时Fermi架构产品的性能和功能在GF100上表现的近乎完美,GF104核心的出现势必将会让更多用户体验到Fermi架构优势。

    而AMD方面,据网络传言报道,其会在6月发布第二代DirectX 11产品。众所周知,每一代DirectX版本的出现,一般都是第二代甚至第三代硬件产品的性能、功能最佳。AMD如果真的能够在6月拿出第二代DirectX 11产品,首先能够成功打击GeForce GTX 400系列,其次能够再次深度打击NVIDIA继续吞噬市场份额,再次用户可以体验到更佳的DirectX 11显卡。

    综上所述,如果你有升级打算,但是并不着急,笔者建议大家等到6月后根据AMD和NVIDIA两家的动作再做决定。6月将会是一个DirectX 11新品井喷期。

151
加载中...