NV高端新力军!55nm GTX260显卡详细评测

太平洋科技
作者:Hero Fan
1 前言
2008年6月,NVIDIA发布了第二代统一架构的GT200显卡GeforceGTX 260和GeforceGTX 280,其中GTX 260是面向高端用户而推出的,性能相比上一代的9800GTX有了很大的提升。当很多用户认为GTX 260的性能将长期领先对手之时,就在同一个月里,AMD也发布了新一代的RV770显卡,其出色的性能甚至使很多用户刮目相看,基于RV770核心的高端显卡Radeon HD 4870,无论市场定位还是性能方面都相当出色,当时只有192个流处理器的GTX 260与其相比,价钱性能均没优势。在这样的情况下,NVIDIA对GTX 260进行了低调的升级,推出拥有216个流处理器的GTX 260。
2000元高端显卡:GTX 260与HD 4870
拥有216个流处理器的新版GTX 260推出后,性能上终于拿回了一些优势,但由于还是采用相对落后的65nm制作工艺,其芯片成本与显卡的制造成本均比较昂贵,货源紧张,不能对HD 4870构成很大的威胁。改进制作工艺、提高产能、降低成本成为NVIDIA的首要任务。到2009年1月,NVIDIA将正式发布基于55nm GT200的三款显卡GTX 260、GTX285和GTX295。
采用55nm制作工艺的GTX 260
作为第一款发布的55nm GT200显卡,55nm的GeFore GTX 260无论是命名上还是产品规格上均与65nm版本保持一致,拥有216个处理器,72个纹理单元,28个ROPs,公版核心/显存频率为576/1998MHz,流处理器频率是1242MHz,显存容量/位宽为896MB/448bit。
虽然55nm GTX 260在规格上于65nm没区别,但由于NVIDIA开放了非公版设计,这意味着有实力的厂商能自行研发低成本的非公版,促使GTX 260的迅速下降。首先上市的55nm GTX 260均采用非公版设计,究竟它与65nm旧版有什么区别?发热和功耗控制如何?对高端显卡有什么样的影响?马上进入55nm GTX 260的详细评测。
2 改进制作工艺!55nm GTX 260低调发布
显卡型号 | Radeon HD 4870 | Geforce GTX260 192SP | Geforce GTX260 216SP | Geforce GTX260 216SP/55nm |
核心代号 | RV770 | GT200 | GT200 | GT200 |
工艺制程 | 55nm | 65nm | 65nm | 55nm |
核心晶体管数量 | 9.56亿 | 14亿 | 14亿 | 14亿 |
核心封装面积 | 260m㎡ | 576m㎡ | 576m㎡ | 576m㎡ |
核心时钟频率 | 750Mhz | 576Mhz | 576Mhz | 576Mhz |
核心Shader频率 | 750Mhz | 1242Mhz | 1242Mhz | 1242Mhz |
显存时钟频率 | 3600Mhz | 1998Mhz | 1998Mhz | 1998Mhz |
显存类型 | GDDR5 | GDDR3 | GDDR3 | GDDR3 |
显存位宽 | 256bit | 448bit | 448bit | 448bit |
显存容量 | 512MB/1GB | 896MB | 896MB | 896MB |
Stream Processor | 800 | 192 | 216 | 216 |
纹理单元 | 40 | 64 | 72 | 72 |
ROPs | 16 | 28 | 28 | 28 |
接口总线 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 |
Shader Model标准 | 4.1 | 4.0 | 4.0 | 4.0 |
DirectX标准 | 10.1 | 10.0 | 10.0 | 10.0 |
互联技术 | CrossfireX | 3-Way SLI | 3-Way SLI | 3-Way SLI |
视频回放技术 | UVD2 | PureVideo HD II/VP2 | PureVideo HD II/VP2 | PureVideo HD II/VP2 |
从2008年6月GeForce GTX 260发布到现在,NVIDIA已对GTX 260进行两次升级,从最初的192流处理器版本到216流处理版本,再进行55nm的工艺改进,或许是这个原因吧,NVIDIA对55nm GTX260的发布非常低调,基本上交给了显卡厂商的跟进。虽然NVIDIA没有提升55nm版本的频率,但由于开放了非公版设计,不少厂商可推出自家的超频版本。
3技术回顾:GT200核心架构分析
GeForce GTX 200系列带来了全新的第二代统一架构。而第二代统一架构最大的特点就是在全部继承第一代统一架构的优点后,提升各单元处理器能力的同时也提升了效率,真正意义上把同一架构发挥至极点。为了适应未来并行运算的需要,GeForce GTX 200系列显卡开创性提供了2种不同的架构——并行处理架构与图形处理器架构。
完整的GT200架构
从上面的架构图可以看出,GeForce GTX 200系列可以分为四个层,最上面一层包括了图形处理器所需要的几何着色器(Geometry Shader)、顶点着色器(Vertex shader)以及像素着色器(Pixel shader)。中间一层包括了10组TPCs(计算处理器群集),每组TPC里面又包含了3组SMs(流处理器组),每组SM里面就包含了8个流处理器单元或计算单元。这样一来,GeForce GTX 200显卡就一共包含了240个流处理器单元或计算单元。在TPCs下面就是纹理单元以Atomic单元(在并行计算中负责处理冲突的单元)。在下面就是ROPs(光栅化处理器引擎)以及显存接口。
优化的shader/TF比值 适应未来的需求
在图形处理方面,GeForce GTX 200可以说有了成倍的性能增加,不仅在流处理数量方面的成倍增加,在跟图形处理器息息相关的几何着色器(Geometry Shader)及数据流输出(Stream Output)、ROPs、纹理填充率以及寄存器方面都有长足的进步。
TPC(计算处理器群集)中多添加了一组SM
目前,越来越多的游戏以及应用程序都需要大量的shaders,未来在shaders以及纹理单元上寻找一个最佳的平衡搭配,GeForce GTX 280显卡在每组TPC中,多添加了一次SM,然后保持TF的数量不变,这样一来shaders与TF的比值要比上代产品提高50%,非常适合目前以及未来的游戏和应用程序的需求。
提升几何着色器及数据流输出(Stream Output)的表现
随着DX10游戏的流行,在DX10规范中首次引用的几何着色器(Geometry Shader)作用用来越显著。为了提升GT200的游戏表现,顶级GeForce GTX 280内部的输出缓冲限制已显著升至上代产品的6倍,提供了更快的几何着色器(Geometry Shader)速度以及数据流输出(Stream Output)表现。
测试DEMO美杜莎很大程度上依赖几何着色器及数据流输出的表现
加倍的寄存器文件
在上代旗舰G80核心中,在每组流处理集(SM)里面添加了高速的本地缓存用于存放shaders之间计算完的活跃数据。但随着编程的复杂度增加,shaders的处理器能力也得到了成倍的增加,一次可完成上千条指令。寄存器的容量就成为了整个核心的瓶颈,当SM内寄存器的容量不足以保存全部处理后的活跃数据时,溢出的数据就会直接存放到显卡的显存当中,而本地显存较大的延时会严重影响性能。为了解决这个问题,适应未来更复杂的编程需求,在GT200核心的寄存器容量直接提升至上代产品的2倍,大大减少了数据溢出到本地显存的机率,使GT200的运算性能更强,运算效率更高。
升级ROPs(光栅化处理器)
最新的 GeForce GTX 200系列GPU ROPs不仅全部支持上代产品的特性,而且还实现了最大32 pixels输出每时钟,等同于八个ROP分区中每个ROP分区输出4 pixels每时钟,同时每个ROP分区在8X MSAA下支持32 色彩和Z采样每时钟。像素方面采用了U8(未签名8 bit整数)数据格式,像素的混合比率是上代产品的2倍。跟仅有6个ROP分区以及支持24 pixels输出每时钟,12 pixels混合每时钟的上代产品相比,GTX 280提升到支持32 pixels输出和混合每时钟。能给用户带来更绚丽更真实的视觉效果。
提高了纹理表现
GeForce GTX 200系列再次提升了纹理的过滤与寻址能力。在每个TPCs(流处理集组)中提供了一个双四纹理(共8个)处理单元,能够提供每时钟8 pixels的双线数寻址和过滤,FB16双向材质过滤可以实现每时钟4 pixel来操作,如果是FP2:1的各向异性过滤也可以每时钟4 pixels来完成。内部集成的10个TPCs能同时完成每时钟80 pixels的双线数寻找和过滤。除此之外,GeForce GTX 200系列还创建了一个非常高效的程序来管理,使其纹理过滤表现能达到理论最大值,性能上较上代GeForce 8800GTX显卡有不少的提升。
4 面向未来:CUDA并行计算的应用
随着显卡的发展,GPU越来越强大,第二代统一渲染架构的Geforce GTX 200系列拥有200多个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
并行处理器在各个方面都有优势
CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。
下面是CUDA实现的GPU并行计算应用:
BadaBoom视频压缩
一直以来,视频编码的转化都是令用户非常头疼的一件事,一款顶级的处理器在转换容量巨人的视频文件的时候,慢如蜗牛的速度令人难以忍受,这也主要受目前CPU性能的制约。目前,NVIDIA与许多软件开发商在推广支持GPU加速的视频压缩软件,Badaboom就是一款支持GPU加速的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的H.264视频格式,据称速度方面是目前CPU转化的10倍以上,为了验证其真实性,我们就做了一次相关的评测。
由于目前这个版本仅支持GPU加速,所以我们并不能拿来与CPU进行同平台对比,考虑到目前参差不齐的编码软件,测试结果仅做主观参考,从软件显示的编码速度来看,编码帧数达到了130帧每秒,一个160M的MPEG-2文件压缩至iphone标准视频仅1分钟内就可以编码完成。这个速度相信已经超过了目前所有的CPU版本编码软件。
连PDF都需要GPU加速
http://www.adobe.com/cn/
早在2007年,Adobe就与NVIDIA展开合作,推出了支持GPU加速的PDF版本,AdobeAcrobat8及AdobeReader8系列产品提供全新的页面显示着色技术,利用GPU来加速PDF格式下的绘图及显示功能,除了在效能上有所增进外,还可以利用GPU的可编程特性,进一步加强PDF文件中的2D内容展示效果。

据Adobe平台产品营销总PamDeziel表示,NVIDIAGeForce与QuadroGPU使用者可利用PDF档案进行更多样的作业,同时也能更有效率。包括平移、卷动、缩放等,实际上AdobeReader8每一项运用到GPU的功能都有着显著的效能增进。使用者过去避免使用的一些应用,例如可进行极精细比例缩放的地图,现在都可以轻易地显示。
打开同样复杂的一幅图表,利用GPU加速你可能会获得更快的浏览速度
同样一个容量达到50MB的期刊读物电子版PDF文件,在使用传统方式打开时,读取时间为8秒。而使用GPU硬件加速功能时,打开时间不超过3秒,且在浏览时不会有拖沓感,PDF文件也变得流畅异常了。
5更真实游戏体验:提供PhysX物理加速
随着NVIDIA收购AGEIA公司,业界最先进的PhysX物理加速技术的加入,让大家对于GPU支持物理加速期待已久。不久前,支持GeForce8/9/200系列的显卡PhysX物理驱动终于发布了,通过物理加速驱动,GPU能分担CPU的工作,从而提高游戏的执行效率,目前主要体现在3DMark Vantage测试中。按照NVIDIA自己宣称的PhysX是目前最先进的物理加速引擎。
PhysX是目前支持平台最多的物理加速引擎,他可以支持目前主流的X86处理器、AGEIA公司的PPU、东芝公司的Cell以及支持CUDA环境的GPU。其中,最令人期待的就是支持CUDA的版本。借助于目前强大的GPU并行运算能力,支持CUDA环境的PhysX物理加速引擎能给用户带来最为真实的性能体验。
随着物理引擎的加入,以后我们就可以在游戏中体验最为真实自然的服装、毛发、烟雾、爆炸等画面,可以进一步的解放目前不堪重负的CPU。目前已有数款游戏宣布支持NVIDIA Geforce PhysX,相信未来会有更多游戏支持物理效果,还原一个更真实的游戏世界。
不带物理驱动的测试成绩
安装物理驱动的测试成绩
从3DMark Vantage的测试中可以看出,安装物理驱动后,CPU成绩暴涨了两倍以上,使得整体的测试成绩也有了一定的提升,这是通过Geforce PhysX分担CPU计算的工作,提高效率的结果。
6 讯景 55nm GTX260赏析
讯景 GTX260(GX-260N-ADF)图 库评 测论 坛报 价
这款讯景 GTX260显卡采用非公版设计,基于GT200核心,制作工艺为55nm,拥有216个处理器,纹理单元有72个,ROPs有28个。显存位宽为448bit,默认核心/显存频率为576/1998MHz,流处理器频率是1242MHz,与公版规格保持一致。从外观上看,这款讯景 GTX260外观与公版较为相似,采用了类型公版GTX260的散热器,黑色的一体式散热器覆盖了整张显卡,热风从侧档板处送出。
类型公版GTX260的散热器
讯景 GTX260采用了黑色PCB板和类似公版GTX260的黑色一体式散热器,看上去份量十足,风扇中间贴有讯景的Logo。
双6PIN PCI-E供电接口
虽然采用了55nm制作工艺,但显卡的功率还是不少的,仍需要双6PIN PCI-E供电接口,以保证显卡长时间稳定运行。
接口部分
讯景 GTX260仍采用主流的双DVI+S-Vedio视频输出接口,通过转接头可以实现HDMI与DisplayPort支持。
7 映众 55nm GTX 260赏析
Inno3D 映众GTX260+(55nm)图 库评 测论 坛报 价
Inno3D 映众GTX260+(55nm)基于GT200核心,采用非公版设计,同样采用类似公版GTX260的散热器,在散热器的面板上,我们可以清楚看到这款映众GTX260+(55nm)特点,采用55nm工艺制程,拥有216个流处理器,纹理单元为72个,ROPs保持在28个。
由于NVIDIA已开发GTX 260的非公版,加上采用了55nm制程,有不少厂商对显卡进行超频,以进一步挖掘显卡的潜力。映众GTX260+(55nm)就是一款超频版的GTX260显卡,核心/显存频率为620/2100MHz,流处理器频率是1242MHz,显存容量/位宽为896MB/448bit。
接口部分
映众GTX260+(55nm)采用主流的双DVI+S-Vedio视频输出接口,通过转接头可以实现HDMI与DisplayPort支持。
GTX 260拆解图
类似公版GTX 260的一体式散热器
映众GTX260+(55nm)采用类似公版的散热器,通过散热垫使显卡上的显存、电感和NVIO芯片等元件紧贴着散热器,使元件的发热量通过散热器带出。散热器中间的核心散热器部分采用导热性能更好的铜材质,内部通过热管与众多散热片连接在一起,通过风扇把热量从侧面档板排出。
SLI接口与NVIO芯片
作为高端显卡,GeForce GTX 260提供了两个SLI接口,支持三张显卡组建三路SLI。GTX 260显卡采用了第二代NVIO芯片,在接口方面更丰富,支持DisplayPort接口,并且带来真正双Dual-Link XHD DVI 10bit每通道的色彩输出能力,拥有更为出色的2D显示效果。
8 55nm GTX260公版非公版拆解对比
55nm GTX 260映众非公版拆解图
GTX 260公版拆解图
我们可以看到,非公版与公版GTX 260最大的区别在于显存的位置以及供电部分,这款映众GTX 260非公版把14颗16Mb*32Bit规格的三星1.0ns GDDR3显存全部放在显卡正面;而公版GTX 260则是把显存分为前后7颗摆放。55nm GTX 260的显存容量/位宽仍是896MB/448bit。
55nm GTX 260非公版背面
映众GTX 260公版背面
采与公版的黑色PCB不同,这款映众GTX260+(55nm)采用蓝色PCB板设计,14颗显存全部放在显卡正面。由于NVIDIA已开放GTX 260的非公版设计,之后将有更多显卡厂商推出非公版GTX 260显卡。
非公版和公版GTX 260供电模块(左为非公版,右为公版)
由于新的非公版GeForce GTX 260采用了55nm制作工艺,供电要求相对降低,但用料仍非常豪华,采用4相核心+2相显存供电方式,全部采用贴片电容、屏蔽电感以及英飞凌Mos管。这意味着,非公版的GTX260售价将有不少下降空间。
55nm和65nm GTX 260核心图(左为55nm版本,右为65nm版本)
从核心对比图可以看到,55nm和65nm的GTX 260核心上均覆盖着一个金属盖,以更好保护核心。正因为有金属盖子,我们没法比较55nm和65nm GT200的核心大小,只能编号上区别两个版本,其中55nm GTX260的编号为“G200-103-B2”,最后的B2则代表采用55nm制作工艺。
55nm GTX 260
65nm GTX 260
GPU-Z并不能正确识别显卡的制作工艺,因为有部分信息是通过查找设备ID与数据库进行匹配来显示的。但从Revision可以判断出,B1则为55nm制作工艺的显卡,A2则是65nm的。
9评测平台及评测方法简介
评测平台 | |
CPU | Intel Core 2 QX9770(OC 400x9=3.6G、12MB L2Cache ) |
主板 | 华硕 Ragemap Fomula (X48+ICH9R) |
内存 | 宇瞻DDR2-1066 1GB x 2 (5-5-5-15) |
硬盘 | 希捷 7200.10 SATA 500G |
显卡 | GeForce GTX 260 896MB(620/2100MHz,SP:1242MHz) |
软件平台 | |
系统软件 | Windows VISTAUltimateSP1 |
驱动程序 | AMD显卡:AMD Catalyst 8.12 For Vista |
评测软件 |
|
本次评测的显卡是55nm GeForce GTX260,由于NVIDIA已经开放非公版设计,之后将有更多厂家推出超频版的55nm GTX 260,因此采用厂家超频的55nm GTX 260显卡进行评测,并加入公版规格的65nm GTX 260以及竞争对手Radeon HD 4870 1GB进行对比参考。
在测试平台上面,我们采用了高端的四核平台Intel Core 2 QX9770,为使CPU不成为屏颈,我们以默认电压超频到3.6G。根据这些显卡的定位,在分辨率上我们选择了1680x1050 0AA / 1920x1200 4AA 以及1920x1200 8AA,以考察它们在低/高负载下的性能差距。考虑到兼容性等问题,开启AA的倍数是由游戏支持度决定,并没有在驱动强制开启。
由于我们选择的测试游戏均不支持Geforce PhysX物理加速,3DMark Vantage的测试结果也在争议之中,因此测试过程中关闭Geforce PhysX物理加速,以更好反映显卡的3D性能。
10DX10测试软件:3DMark Vantage测试
新的3DMark测试工具——3DMark Vantage并没有提供对显卡DirectX 9性能的测试部分,因为FutureMark认为,作为DirectX 9.0C的测试工具,3DMark 2006就已经很好的反映显卡的DirectX 9性能,因此3DMark Vantage是一款完全针对DirectX 10开发的测试软件,用户也需要安装支持DirectX 10的Windows Vista才能运行,看来Windows XP和DirectX 9显卡用户是和这款3D测试工具无缘了。
3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。
主要分了四个测试项目
3DMark Vantage 总得分标准:
3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数/ CPU总分)
3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
Entry | Performance | High | Extreme | |
显卡权重系数 | 0.75 | 0.75 | 0.85 | 0.95 |
CPU权重系数 | 0.25 | 0.25 | 0.15 | 0.05 |
测试结果:
在3DMark Vantage的测试中可以看到,随着驱动的更新,GTX260与HD 4870测试成绩均有了一定的提升,在测试中我们没有开启PhysX物理加速,但依然可以看到,无论是总分还是CPU的得分,公版规格的GTX 260仍然比HD 4870 1G高600多分,约16%。
11 DX10游戏对比评测:《孤岛惊魂2》
FarCry2《孤岛惊魂2》是一款DX10游戏,我们采用自带BenchMark进行测试,模式为DirectX 10,品质为Very High,分辨率设定为主流的1680x1050 0AA、1920x1200 4AA和1920x1200 8AA。
在FarCry2的测试中,GTX 260小幅领先于HD 4870 1G。但在1920x1200 8AA的高负载下,GTX 260领先HD 4870 1G幅度接近30%,排除了显存容量的原因,在此游戏中,GT200架构无疑更有优势。
12DX10游戏对比评测:《孤岛危机》
测试画质说明
Crysis《孤岛危机》作为目前对显卡要求最高的DX10游戏,以出色的游戏画面著称。在本次评测中,我们将分辨率锁定在1680x1050、1920x1080所有的画面设置都调为HIGH,同时关闭/开启AA和AF,使用目前最新的Benchmark测试。
在“显卡危机”的测试中,不开AA的情况下,GTX 260稍稍领先HD 4870 1G。但随着分辨率的提高,出现了HD 4870 1G反超的情况,在1920x1080 8AA下HD 4870表现更为出色。
13DX10游戏对比评测:《鬼泣4》
游戏说明
鬼泣系列是家用游戏机上的百万销量大作,最新续作鬼泣4在推出不久便破百万销量。在PC平台推出的版本还支持DirectX 10,画面上有了进一步的提升。测试画面设置如图所示,所有特效开至最高,关闭垂直同步。在本次测试中我们选择了游戏过程中的场景进行测试,跑动一段路程用Fraps记下平均帧数,取3次成绩的平均值为测试分数。
鬼泣4中选用的测试场景
鬼泣4采用失落星球的引擎开发,在这个实际游戏场景中,GTX 260更为占优,尤其是在高负载环境下,GTX 260以较大幅度领先HD 4870 1G。
9.6DX10游戏对比评测:《英雄连:抵抗前线》
测试画质设定
采用自带Benchmark测试,版本为2.201
上图是关于英雄连《Company Of Heroes:Opposing Fronts》的测试画质设定:Shadow Quality设置为DirecetX 10模式、全部特效都开启至最高,分辨率为1680x1050、1920x1200 4AA,1920x1200 8AA,由于NVIDIA的显卡在该游戏中不提供8X MSAA支持,因此选择了8X CSAA代替。
在英雄连:抵抗前线测试中,同样出现GTX 260明显领先HD 4870的情况。
15DX10游戏对比评测:《生化奇兵》
画质设置介绍
《生化奇兵》是一款基于虚拟3引擎开发的游戏。游戏画质设置说明:测试期间我们采用全屏模式进行,关闭游戏的垂直同步功能,开启DX10模式,再将游戏特效设置为官方的高级特效水平。
测试选用的场景
测试场景:测试场景我们选用游戏中的第一个Auto Save场景——Welcome to Rapture,当中主角又潜水仓进入Rapture浮出水面的一段。游戏速度监测部分我们采用Fraps进行平均帧数的监测,每个分辨率测试三次,选取平均值的作为测试成绩。
由于生化奇兵游戏中不提抗锯齿AA的支持,为考虑到兼容性问题,没在驱动中强制打开抗锯齿。在这个情况下,GTX260稍领先于HD 4870。
16DX9游戏对比评测:《使命召唤:世界大战》
画质说明
设置界面
测试场景
游戏所有特效开至游戏能够支持的最高级别,同时关闭垂直同步,分辨率为1680x1050 0AA和1920x1200 4AA。我们选择了第二关开头为测试场景,从开始直到运兵船靠岸结束,用Fraps记下平均帧数。
作为人气射击大作,使命召唤系列一直受到广泛关注。在第二关的测试场景中,超频版GTX 260与公版区别不明显,而HD 4870 1G则强于GTX 260。
17DX9游戏对比评测:《半条命2:第二章》
画质设置介绍
《半条命2:第二章》引擎在HDR和游戏解说系统上继续增强。《半条命2:第二章》引擎当中的游戏子引擎将支持豪华的室外场景,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。《半条命2:第二章》引擎引入全新的粒子系统,将提供动态软阴影效果。《半条命2:第二章》引擎当中的物理子引擎也经过重新设计,提供大场景大范围的物理效果。下面是关于《半条命2:第二章》的画质设定及评测说明。我们将游戏的特效全部开至最高,同时关闭AA/AF。
测试选用的场景
《半条命2:第二章》的评测我们选择了崖边的场景,测试过程中,我们跑到崖边等待游戏画面的闪光至震荡完毕,用Fraps记下3次的成绩取其平均值的最大值为测试成绩。
半条命2的测试中,可看到GTX 260在0AA与4AA分辨率领先HD 4870,但开启8AA后,HD 4870则反超GTX 260,从下降幅度以及8AA的效率上考虑,HD 4870在此游戏的8AA表现更为出色。
18显卡温度与功耗测试
温度测试:
55nm Geforce GTX 260的最大改进就是工艺上,更先进的55nm工艺使功耗和温度均有一定下降。温度方面,我们采用ATITOOL进行烤机,10分钟后记录显卡最高温度为满载温度,然后待机5分钟,记录温度为待机温度。测试环境保持在26摄氏度。
测试方法
从评测中我们可以看到,55nm GTX 260相比65nm GTX 260有一定降低,待机温度低了10摄氏度,满载温度也低了3摄氏度。而仿公版的风扇噪音控制也非常出色,测试过程基本听不到噪音。反观我们这块HD 4870 1G,由于BIOS已设定了风扇转速随温度升高而提速,因此在温度控制方面相比之前的版本有明显改善,但显卡满载时却带来更大的噪音。
功耗测试:
55nm Geforce GTX 260的最大改进,我们进行了新旧版GTX 260功耗对比测试,并加入65nm GTX 260与HD 4870 1GB作为参考对象。采用ATITOOL使显卡满载,此时CPU不满载,待读数稳定时记录数据。(测试过程QX9770以默认电压超频到3.6G,并关闭节能技术,下面的读数为整机功耗)
从测试结果可以看出,55nm GTX 260的功耗也有了一定的改善,满载时相比65nm低了10多瓦。其中这款HD 4850 1G待机高达175瓦,这不是一个正常的HD 4870待机功率,初步估计是与该显卡的节能技术失效有关。
19 55nm的威力!核心频率轻松突破700MHz
GeForce GTX 260采用55nm制作工艺后,温度与频率均有了一定的降低,但对于不少玩家而言,其超频潜力也是不可忽视的,下面我们对它进行了超频测试。
默认620核心频率下的成绩
核心超频到730后的成绩
采用更为先进的55nm的制作工艺后,显卡的超频潜力也大幅提升,这款GTX 260的核心频率轻松便超过700MHz,达到730MHz,从3DMark Vantage的GPU成绩可看到,超频前为9740,超频后为10958,性能提升达13%。
20PConline评测室总结
55nm GTX 260将继续与HD 4870展开激烈竞争
从评测结果分析:
随着驱动的完善,NVIDIA/AMD新一代显卡Geforce GTX 260与Radeon HD 4870的性能均有了一定的提高,以3DMark Vantage的成绩较为明显。综合评测结果来看,拥有216个流处理器的Geforce GTX 260在多数游戏中领先于Radeon HD 4870 1G,只有在少数游戏以及某些的8AA环境下,GTX 260落后于HD 4870,如孤岛危机、使命召唤5和半条命2。
55nm的GTX 260相比旧版65nm,更大的改进体现在功耗控制与发热量上,满载时55nm版本比65nm版本低10多瓦。而超频潜力也很值得期待,我们手上这片55nm GTX 260,核心频率已能轻松上700MHz,以后将有更多厂商推出超频版的显卡。
市场定位分析:
Radeon HD 4870与Geforce GTX 260一直处于相互竞争的状态,目前GTX 260报价为1799-1999元,而HD 4870 512M/1G则分别杀到1799元和1899元,虽然GTX 260在性能上稍领先,但由于制造成本较高,且产能不足,货源比不上HD 4870,在这样的情况下,更多用户会选择HD 4870。现在,GTX 260已采用55nm制作工艺,加上NVIDIA已开放GTX 260的非公版设计,这样更多显卡厂商能自行生产非公版的GTX 260,其价格也将进一步降低,笔者估计,不久便会有厂商把GTX 260杀到1500元。
未来发展预测:
采用55nm制作工艺的Geforce GTX 260可以说是第三版的GTX 260显卡,但除了工艺外并没有其它改进,频率依然与65nm版本保持一致,因此它的上市也非常低调。但55nm GTX260的发布对显卡市场有着重大意义,先进的制作工艺将使芯片成本降低,加上NVIDIA开放其非公版设计,有实力的显卡厂商可设计出COSTDOWN的非公版,而GTX 260的价格也因此而下调,这样必然会对HD 4870造成非常大的威胁,有望重新夺回HD 4870被拿下的市场份额。
09年显卡市场的竞争将更为激烈,笔者相信不久便会有厂商进行对55nm GTX260进行一次杀价,届时将有更多高端用户把焦点转移到GTX 260上。究竟哪个厂商会先把价格杀到1500元?AMD方面又会以什么方法应对呢?不久之后自有分晓。