新浪科技

最惨烈较量 HD6800与GTX400超频性能对决

中关村在线

关注

HD6800冲击中高端市场

作为AMD第二代DirectX 11架构GPU芯片,HD6000系列的发布对整个显卡市场带来了巨大影响,在NVIDIA发布GTX400仅半年时间后AMD就升级了其GPU产品线,无论是对厂商还是用户而言都有些出乎意料。

虽然HD6000系列显卡在硬件架构方面选择优化和延续上代产品,但是由于额定高频和增加的一组线程发射器,还是能够在2000元和1300元价位上轻松战胜自家上一代产品和竞争对手的GTX470/GTX460等经典显卡。


在NVIDIA方面,2010年3月27日发布的第一代Fermi架构GF100芯片让无数用户看到了架构改进带来的至强DirectX 11性能和前所未有的游戏体验,但是基于第一代架构的GTX480/470/465显卡免不了忍受高发热高功耗的苦恼。同时NVIDIA过于偏向HPC领 域的设计方向让GF100芯片在通用计算方面的性能不容置疑,图形处理则反倒受到牵制。

其实与GF100芯片同期设计的还有NVIDIA改进版Fermi架构——GF104芯片。它仅有19.5亿晶体管规模,但是效能比达到了前所未有的高度。同时在1200-1500价格段,这款被命名为GTX460的显卡拥有竞争对手无可比拟的优势。

Radeon HD 6800 系 列 显 卡 对 位 产 品 规 格 比 较 表
显卡型号Radeon HD 6870Radeon HD 6850GeForce GTX 470GeForce GTX 460GeForce GTX 460
市场定价1999-18991399-12992888 元1499 元1299 元
GPU代号BartsBartsGF100GF104GF104
GPU工艺40 nm40 nm40 nm40 nm40 nm
GPU晶体管17 亿17 亿32 亿19.5 亿19.5 亿
着色器数量1120960448336336
着色器组织(1D+4D) *224(1D+4D) *1921D *4481D *3361D *336
ROPs数量3232403224
纹理单元数量5648565656
核心频率900 MHz775 MHz607 MHz675 MHz675 MHz
着色器频率900 MHz775 MHz1215 MHz1350 MHz1350 MHz
理论计算能力2.02 TFLOPs1.49 TFLOPs1.63 TFLOPs1.36 TFLOPs1.36 TFLOPs
等效内存频率4200 MHz4000 MHz3398 MHz3600 MHz3600 MHz
内存位宽256 bit256 bit320 bit256 bit192bit
内存带宽134.4 GB/s128 GB/s135.9 GB/s115.2 GB/s86.4 GB/s
内存类型GDDR5GDDR5GDDR5GDDR5GDDR5
内存容量1024 MB1024 MB1280 MB1024 MB768 MB
DX版本支持1111111111
HD视频技术UVD3UVD3PureVideo HDPureVideo HDPureVideo HD
通用计算接口StreamStreamCUDACUDACUDA

今天我们的测试主要针对1000-2000元市场上的5款明星产品——GTX460 768MB、GTX460 1024MB、GTX470、HD6850、HD6870进行默认性能和超频性能测试,所有显卡均为公版设计并正在市售的普通显卡,驱动采用NVIDIA 和AMD近期发布的WHQL认证最新版本。

HD6800系列产品新特性

本次发布的HD6800系列显卡作为第二代DirectX 11架构设计,并没有像我们之前所预期的对RV870架构进行伤筋动骨的改进,而是通过提高固定单元频率和改进线程分配能力达到了更高的流处理器资源利用 率。最重要的是HD6800并非最高端单卡,它不代表HD6000系列的顶级性能,但是它在1200-1800元人民币之间的市场定位使之成为甜蜜点战略 的核心。


Barts核心的设计目标主要有以下几点:

1、在较低功耗和价格上对AMD Radeon HD 5800系列进行性能优化
2、提供当前最佳性能/性能/平方毫米
3、功耗低于150瓦显卡市场当中性能最高产品

为达成以上目标,AMD在设计Barts核心时选择了以下几种方式:

1、设计一颗集成度不高于19亿的核心,和对手的GF104相仿
2、改进HD5000的线程分配能力和固定单元几何处理能力
3、必须严格控制功耗,依靠半导体工艺来提升性耗比

这里我们使用价格/面积比值来对比一下,可以发现AMD相比NVIDIA在单位面积里面能够创造更多的价值。Barts核心比值为0.98美元/mm2,GF 104核心则为0.46美元/mm2。这样的情况也出现在了高端芯片组方面,Cayman[HD 6900]比值为1.05美元/mm2,NVIDIA方面的GF 100为0.94美元/mm2。通过这次的更新换代,AMD在芯片方面的利润走在了NVIDIA的前面。

核心价格-面积比值

核心型号

核心面积(mm2)

比值(美元/mm2)

GF 100

529

0.94

GF 104

367

0.46

Antilles

760

N/A

Cypress

336

N/A

Cayman

380

1.05

Barts

230

0.98

Juniper

166

N/A

AMD的Cayman[HD 6900]核心实际面积是380mm2,相对于Cypress[HD 5850/5870/5970]核心多了43mm2。Barts核心面积为230mm2,相对于其前辈Juniper的166mm2增加了不少。

本次Barts在核心架构上的变化主要有三点:

1、Tessellator数量仍为1组,但是为增强型的Tessllator Gen7。
2、线程控制器由Cypress的一组变为Barts现在的两组。
3、UVD引擎升级至第三代,提供了更多功能及格式的图形核心计算模式。

其中线程控制器分为两组,是HD6800系列Barts核心性能提升的主要因素,两组线程控制器同时工作能够更有效的发挥流处理器的并行计算能 力。这一改革让HD6000拥有更丰富的指令缓存和发射端资源,虽然两个UTDP单元还是采用抢占式资源分配模式,但是面对庞大的流处理器阵列时效果会比 一个UTDP单元好很多。

如果不考虑运行频率,HD5850和HD6870的区别只在于SIMD Core组数,也就是流处理器数量,两款芯片的固定单元数量是基本相等的(HD6800纹理单元有减少,UTDP单元翻倍)。但是当HD6870披上高频 外衣之后,其线程分配能力、几何吞吐能力、光栅化与Z轴处理能力都获得了线性提升。

GTX460/470做工用料回顾

GeForce GTX 460沿用了GeForce GTX 200以来在中高端采用100%导风罩的设计,不过散热器风扇的位置发生了明显变化,由右侧离心式风扇改为中央的轴流式风扇。接口方面延续了 GeForce GTX 400系列的双DVI搭配Mini HDMI的组合。


显卡采用了3+1相供电设计,每相供电模组均为铁素屏蔽式电感搭配2个电容的组合。同时产品标配2个6pin外接供电,最大提供225瓦的能源输入。

GeForce GTX 470的拆解过程我们在GTX480首测中已经详细分析过,现在让我们再来简单回顾。与GeForce GTX 480的拆解一样,相对以往高端系列而言要较为轻松,尤其是卡口式导风罩的引入。

GeForce GTX 470的供电部分全部被设计在PCB正面的右侧,核心供电模组与显存供电模组位于上下两边,右上角为两个6pin外接供电,搭配PCI-Express提供的75w,共能实现225w的电能供应。

4相核心供电采用铁素体屏蔽式电感、优质Mosfet和固态电容组成。1相显存供电采用1个屏蔽式电感、2个固态电容和3个Mosfet的组合。除了PCB正面我们能够看到的供电模组电气件外,PCB背面还有核心、显存4+1相供电的钽电容。

● HD6800系列做工用料回顾

我们知道Radeon HD 6800系列并非6系的旗舰系列产品,而是主攻1000元至2000元高性能端性价比产品,所以其产品在用料及设计上在充分考虑稳定、冗余的前提下做到高性价比。首先让我们来欣赏一下Radeon HD 6870 PCB设计。

显卡供电采用了4+1的模组设计,其中4相位核心供电、1相为显存供电。公版产品为了保证供电模组的滤波效能,每相供电均使用了屏蔽式铁素电感、固态电容和优质Mosfet的组合。同时为了保证公版频率下151瓦的TDP,显卡还标配有2个pin外接供电。

公版Radeon HD 6850的散热器整体设计思路和外观,与Radeon HD 6870产品大同小异,可以看作是其小号版。而XFX讯景这款散热器完全与公版产品设计思路不同,我们会在后面的散热器拆解中详细介绍。

公版Radeon HD 6850的PCB设计与Radeon HD 6870思路相同,核心、显存供电居左,避开显存颗粒的电气干扰。同时核心居中,8颗显存呈"L"型围绕Barts核心展开。

公版Radeon HD 6850采用了3+1的供电模组设计,每相供电均采用屏蔽式铁素电感、固态电容和优势Mosfet的组合。同时为了满足130多瓦的TDP设计,显卡还标配有1个6pin外接供电。

值得一提的是,在核心3相供电和外接供电中,均预留有增配位置,这也许是为未来Radeon HD 6850高频产品的生产而预留。

5款显卡超频性能展示

本次我们选用的显卡全部为市售公版或最接近公版的产品,这些显卡可以轻易买到并且价格实惠,我们没有选用特殊的加强散热或供电非公版产品。值得一提的是所有显卡不论AMD还是NVIDIA产品,我们在超频时都没有榨取全部性能。

我们使用Furmark 1.8.0来检测5款显卡的超频结果,进入软件后选择稳定性测试,极端折磨模式。当GPU核心温度运行平稳之后图退出。虽然在后期的3DMark和天堂2 测试中证明目前Furmark不是负载最大的测试项目,不过Furmark的确是最为简单易行的稳定性测试软件,其温度绘制功能也能较为清晰地展示显卡工 作状态。


本次测试的两款GTX460产品,没有能够迈过900MHz核心频率门槛。因为笔者不想给它施加非常高的电压,这种状态下显卡无法长期运行。

HD6800系列的两款显卡同样采用驱动超频方式,没有电压调节选项,不过我们最后取得的成绩对AMD还是非常有利的。本次测试中Radeon HD 6870的频率超至1000MHz/4980MHz,Radeon HD 6850超至850/4800MHz。

测试系统硬件环境

性能测试使用的硬件平台由Intel Core i7-870 3.5GHz、ASUS P7P55D Deluxe主板和2GB*2双通道DDR3-1600内存构成。细节及软件 环境设定见下表:

测 试 平 台 硬 件
中央处理器Intel Core i7-870 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器Thermalright Ultra-120 eXtreme
(单个120mm*25mm风扇 / 1600RPM)
内存模组Apacer 猎豹二代双通道套装/PC3-12800
(SPD:1757 9-9-9-24-1T)
主板ASUS P7P55D Deluxe
(Intel P55 + ICH10R Chipset)
显示卡
AMD 产 品
Radeon HD 6870
(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 显存:4200 Mhz)
Radeon HD 6850
(Barts / 1024MB / 核心:775MHz / Shader:775Mhz / 显存:4000 Mhz)
NVIDIA 产 品
GeForce GTX 470 1280MB
(GF100 / 1280MB / 核心:607MHz / Shader:1215Mhz / 显存:3348 Mhz)
GeForce GTX 460 1024MB
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz)
GeForce GTX 460 768MB
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz)
硬盘Hitachi 1T
(1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区)
电源供应器鑫谷GP850 80PLUS金牌电源
(ATX12V 2.0 / 750W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)
 


我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供,电源系统有鑫谷提供。

● 测试系统的软件环境

操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动
Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.10)
NVIDIA Forceware for Win7
(WHQL / 版本号 260.89)

桌面环境

2560*1600_32bit 60Hz

测 试 平 台 软 件
3D合成
测试软件
3Dmark Vantage
Futuremark / 版本号1.2
3D游戏
测试项目
DirectX 11游戏
Colin McRae DiRT 2
Codemasters / 版本号 1.01
Lost Planet 2
Copcom / 版本号 1.0
Tessellation测试
Heaven Benchmark 2.1
UNIGINE / 版本号 2.1
辅助测试软件Fraps
beepa / 版本号 3.2.3
 

各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。

● DX10理论性能测试:3Dmark Vantage

3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。


● DX11理论测试-天堂2.1

《Heaven Benchmark 2.1》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持 DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。


>>游戏类型:DirectX 9/10/11及OpenGL Benchmark
>>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

● Colin McRae:DiRT2

《科林麦克雷:尘埃》本身是一款为纪念去世的英国拉力赛车手科林。麦克雷(Colin McRae)而制作的游戏,因此在游戏过程中不难见到许多麦克雷过往的身影,距前作将近二年多之久的《科林麦克雷:尘埃2》于2009月12月11日正式 发售。值得一提的是,这款游戏不仅拥有很高的可玩性,同时还是率先支持DirectX 11 API的游戏,一经上市就得到广大游戏爱好者争相追捧。


>>游戏类型:DirectX 11竞速类游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的赛车过场回放
>>画质设定:全部最高

● Lost Planet 2

《失落的星球2》背景设在原来第一季的十年后。气候变化融化冰雪覆盖的大陆,创造了新的环境,如丛林。在EDN- 3rd的改变下,10年过去了。地球发生了重大改变,冰川已经融化,热带丛林,沙漠冷酷无情。玩家将进入新的环境,与雪贼战斗,以抓住不断变化的地球控制 权。玩家将控制他们的英雄跨越6个相互关联的事件,创造一个真正独特的互动体验。有了这个概念,玩家将会有机会从不同的发展角度来动态的改变故事情节。


>>游戏类型:DirectX11 第一人称视角射击游戏
>>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

● 出乎意料的尴尬结果

我们抱着对TSMC 40nm CMP碱洗工艺的信心,在之前多篇新闻和评论分析之后完成了这篇测试文章,但是结果有点差强人意。也许是我个人太期待新工艺带给HD6800系列 Barts核心的改进,而忽略了这款产品特别是HD6870已经高达900MHz的核心频率和暂时难以逾越的显存频率。


回忆前文所分析的HD6800系列在做工方面的特性,我们认为公版前置4+1的模组设计存在很大程度的成本考虑,毕 竟这是一颗需要冲击1000-2000元市场的GPU核心。同时40nm CMP碱洗工艺目前不能提供令AMD满意的良率,所以在板卡设计方面更要小心翼翼。在目前4+1项前置供电方案下,HD6870核心可以达到1GHz左 右,外站有测试可以达到1030MHz,因体质而异。

此外Barts核心的显存频率和GF100核心刚上市时遇到了同样的问题,提升非常艰难,我们猜测这和显存控制器的调试存在一定关系,当然有网友用“铅笔大法”短路电阻提高显存电压,但最终只是超到1180MHz,这个频率还没有达到我们本次测试的HD6870层级。

超 频 结 果 对 比

核心型号

默认核心频率

超频核心频率

超频幅度3DMark提升(P模式)

GTX460 768MB

675

875

29.62%25.46%

GTX460 1024MB

675

880

30.37%26.47%

GTX470

608

800

31.57%28.66%

HD6870

900

1000

11.11%6.78%

HD6850

775

850

9.67%7.61%

本次超频测试我们得到以上结果,其中两块GTX460我们没有挖掘最终潜力,所以都没有超越900MHz这个门槛, 而GTX470在发布8个月后已经日渐成熟,可以拥有30%以上的超频幅度。两款HD6800因为额定频率和做工限制,只能在10%的超频幅度徘徊,这不 得不说是本次测试的最大遗憾。

换个角度来看,如果将所有的用户体验提升都寄托在芯片频率上,所有的性能提升都寄托在半导体工艺的进步上,这肯定不 是一个合理的选择。尽管有TSMC使用了新的碱洗工艺不断提升频率并平衡芯片良率,尽管Barts核心此次晶体管集成度已经下降到17亿个晶体管,但是这 种工艺上的优势基本上要被耗尽了。也许放大流处理器规模是一个不错的选择,但是未来芯片内的线长问题又会不断困扰AMD。这一点我们在《AMD统一渲染架 构》一文中已经做过分析。

也许2006年收购ATI是一个艰难而又不得不完成的任务,也许AMD早已仔细分析过独立显卡的市场份额和GPU的 发展轨迹,并看到了Fusion架构的前景。所以从HD2000到HD6000期间,AMD在每一代产品中都选择了最小的研发代价,攻占“甜蜜点”市场将 成为AMD GPU产品的主要任务。面对长期无大幅度改进的GPU架构,面对已经被自己消耗殆尽的半导体工艺余量,的确AMD目前正在经历煎熬。

无论如何,AMD在本次HD6800系列中采取提升频率的方式来换取固定单元和几何性能提升是一种可取的思路。首先 精简流处理器数量,尽力缩小芯片集成度和面积,在此基础上加之TSMC 40nm CMP碱洗工艺做支撑,将HD6800系列运行频率提升到前所未有的高度,使线程分配能力和几何处理能力依靠高频的固定单元获得重要提升,进一步减弱了 RV870架构的设计短板。

加载中...