何处提升 GTX580特性与Win7 SP1测试

中关村在线
前言:NVIDIA发布全新的GF110芯片无疑是最近显卡市场上的一大亮点,虽然架构延续了Fermi的经典特性,但是它采用了全新的EDA设计让功耗和发热大降,无论是制造商还是用户都对Geforce GTX580给予充分肯定。那GF110相对与GF100的提升在何处?GTX580相对与GTX480有哪些本质区别?
我们知道微软选择在今年底发布了Windows 7 SP1升级包,这次升级除了对安全性和兼容性提升之外,对硬件运行效率有多大提升?这篇文章将结合这两个重点为大家展示升级版GPU和升级版操作系统之间的性能关系。
● Windows 7将升级 SP1蓄势待发
俗话说“好马配好鞍”,随着第二代DirectX 11显卡的崭露头角,作为软件平台的Windows 7也将迎来第一次大升级。随着无限接近正式版的SP1补丁公测版官方提供,让我们能够有机会正式尝鲜这次Windows 7设计带来的改变。
尤其是在用户关心的3D性能和GPU功能方面,Windows 7 SP1会给我们带来何等体验呢?在昨天发布的《A/N游戏实测 Win7最新SP1是否值得升级》一文中,我们揭秘了Windows 7 SP1在3D性能方面的表现,本文将以GPU的通用计算功能和一些底层计算性能为基础展开测试。
同时我们还会引入试下最惹眼的顶级显卡GeForce GTX 580,虽然在《比GTX480快20% 卡皇完全体GTX580首测》一文中对其有了多方面的了解,本文将借助Windows 7 SP1这个点从另外一面给大家展示GeForce GTX 580。
● GF110芯片内部改进推断
在经历了2010年3月27日首个Fermi架构GF100芯片发布之后,显卡领域无论是制造商还是普通用户,都看到了NVIDIA在面向未来应用方面的改进。但是这种彻底地改进引来了很多非议,首当其冲是其巨大的发热和功耗问题,这种可制造性问题如果得不到很好解决,用户获得再强大的性能也无法摆脱发热和功耗的折磨,产品成本也会不断提升。
正是在这种背景之下,一块崭新的GF110芯片诞生了。它仅是补全了GF100芯片屏蔽的流处理器和功能单元吗?虽然大多数人是这样认为的,但是事实证明大多数人都错了。虽然这颗芯片的架构完全和GF100芯片相同,但是却经过了彻底推倒重来的EDA设计。
我们通常习惯把30亿晶体管的GF100芯片所产生的发热原因,归结与TSMC 40nm工艺不够成熟所致,当然NVIDIA设计这样大的一颗芯片也可以认为是战略错误。实际上GPU芯片的EDA设计方案都是NVIDIA自己完成的,所以NVIDIA仓促的EDA设计才是导致GF100芯片发热巨大的根源。
EDA技术是以计算机为工具,设计者在EDA软件平台上,用硬件描述语言HDL完成设计文件,然后由计算机自动地完成逻辑编译、化简、分割、综合、优化、布局、布线和仿真,直至对于特定目标芯片的适配编译、逻辑映射和编程下载等工作。
NVIDIA在2008年开始了Fermi架构的仿真设计,传言在2009年初诞生了一块512SP,512bit,128TMU的大号芯片,这是最初的GF100,但是很可惜由于晶体管开销巨大和发热功耗不可控,这颗芯片后来流产了。
此后经过精简的GF100芯片诞生了,但它还是一个30亿晶体管的大家伙。在2009年末基于GF100芯片的Tesla首先登场,这批芯片额定频率较低,开启448个流处理器,所以功耗和发热问题并没有完全暴露。直到今年初发布GF100芯片,各种各样的麻烦问题才被人们所重视。
晶体管集成度较高的芯片,或者说互联层数多的芯片,设计要考虑磁通量和寄生电感等等不和谐因素,有资料表明G80开始NVIDIA就考虑通过络磁点来降低磁通量,寄生电感。
以最为重要的络磁点举例,络磁点是N个强度差不多的磁通线同时穿越的地方,如果络磁点考虑不好,造成多条磁通线同时穿越同一位置,磁通量会变得特别强烈,会造成芯片发热不可控。磁通量和热量一般是正相关的,磁力会驱动离散电子做定向移动从而产生电流,进而转化为热量,不过这里用电子还不如用载流子更为贴切。
在NVIDIA的GPU方面,大家熟知的EDA改进设计有两个经典案例,首先是Geforce 8800GTX之后推出的Geforce 8800Ultra经过了非常完美的EDA设计,在频率提升的前提下功耗下降。第二个案例就是GF104芯片,性能功耗比大幅度超越GF100芯片,Geforce GTX460因此而得到市场的一致肯定。
这次推出的GF110芯片,正是NVIDIA痛定思痛下决心改进的一颗大芯片,由于选用了业内顶尖的设计团队,基于GF110芯片的Geforce GTX580在开启全部512个流处理器和16个Tessellator之后依然保持了低于Geforce GTX480的功耗和发热,这就是NVIDIA提出的全新EDA设计方案带来的效果。
● GTX580均热板技术详解
在GTX480刚刚上市不久,AMD以HD6800系列一记重拳打向显卡市场,本以为会大赚人气、狂澜横财,但是没想到天算不如人算,AMD又被NV摆了一道。GTX580的亮相,又将人们把视线从新拉回高端性能PK的混战上。GTX580凭借高性能、低功耗、超强超频能力,以及强悍的散热性能,让号称“卡皇”的5970也望尘莫及。
而在近日,NV公司公布了GTX580散热技术细节。官方表示,GTX580之所以拥有强悍的散热性能,主要是因为显卡采用了“vapor-chamber ”均热板的散热解决方案。
均热板,英文名叫做“Vapor Chamber”,其在散热方式上与Heat Pipe(热管)相比热量传导更有效,Heat Pipe为线性传导而Vapor Chamber为2维平面传导,导热、散热效率更高。由于Vapor Chamber热阻值很低,仅为纯铜材质的的1/2,也就是说Vapor Chamber的热导效率为纯铜的两倍,散热效率高。
Vapor Chamber的物理结构共分为5个技术层和8个物理层,由上至下分别为上表面、冷凝层、汽化层、导热层和下表面,其中冷凝层、汽化层和导热层分别为2层。
这是Vapor Chamber的工作原理图,从吸热底吸收热量一直到冷凝液散热冷凝。
这是Vapor Chamber内部结构在35倍、100倍和200倍显微镜下的实物结构图。
这是Vapor Chamber散热块(下)和普通散热块,在散热状态下的热量分布图。很明显普通散热块在热源处温度极高,热量扇形球状分布、热量分布不均;反观Vapor Chamber散热器,整个散热器不仅没有温度过高趋于,而且热量分布均匀散热效能强劲。
这是对比普通散热器(左)、Heat Pipe散热器(中)和Vapor Chamber散热器(右)在相同热源下的热量传导情况,很明显导热、散热效率一次提升,Vapor Chamber效果最佳。
● 全新功耗控制与保护机制
在本次发布的Geforce GTX580显卡中,NVIDIA终于按耐不住使用了硬件芯片来控制整卡功耗,同时保护供电电路和GPU芯片不被烧毁,这种方式AMD在HD5000系列中也已经开始使用。
从Radeon HD5000系列开始,AMD不认为Furmark,OTTC代表了真实的游戏功耗环境。通过首先在Cypress家族内置监控芯片,VRM过载(overcurrent)的时候,芯片会自动降频到上一个powerplay 水平,直到过载减弱(或者VRM温度恢复正常)。考虑到HD4000系列的极端功耗和TPD差距极大,而且HD5000系列采用clock gating和GDDR5完整节能特性仅对待机功耗帮助巨大。
NVIDIA在Geforce GTX580更进一步,内置的监控芯片实时收集PCIe接口和电源用量,反馈给驱动,让驱动决定是否降频运行以控制GPU功耗。
似乎Furmark、OCCT这一类极端的拷机程序都不太受AMD和NVIDIA的欢迎,NVIDIA甚至用"pathological”(病态)这样的词来形容Furmark,这些程序确实是把显卡折磨得够呛,它们能让显卡超负荷运转,根据多次测试,大致了解到运行Furmark能让显卡功耗超出规范值的20-50%。
GeForce GTX 580的Power Limiter功能对显卡长期满载时进行频率调整,以便将整卡控制在一个较为合理的功耗范围内,而Furmark不幸“中招”,所以GeForce GTX 580功耗测试,笔者挑选了一个相对功耗负载较大的游戏进行测试。
在功耗测试中,GeForce GTX 580的单卡整机待机和满载功耗分别是140瓦和359瓦,相比原GF100核心产品及Radeon HD 5870而言,这个功耗表现非常出色,从原来GF100的功耗大户变成了现在的节电先锋。
超能网在破解了GeForce GTX 580的Power Limiter功能后,使用Furmark软件对这款显卡的原始功耗进行测试得到上图结果。这项测试证明了GeForce GTX 580和上代GeForce GTX 480相比,GTX 580拥有更多的流处理器数和更高的工作频率,但是它的“真实功耗”和“真实温度”都比GTX 480要略低(5W/5℃),可以说GTX 580在硬件上的优化是很明显的,晶体管的漏电更小。
GF110核心的超频能力着实让笔者为之惊叹,使用NVIDIA Inspector软件经过简单的调校,产品频率轻松超至900MHz/1800MHz/4400MHz,此时性能得到大幅提升。在3Dmark Vantage Performance测试中,超频后GeForce GTX 580轻松破3万分。
● 规格补全Fermi架构所有遗憾
在确认了GF110核心在半导体工艺方面的稳定特性之后,NVIDIA打开了当初Fermi架构全部的512个流处理器,并且将芯片额定频率提升到772MHz,显存频率达到4000MHz,这时的GeForce GTX 580已经能够大幅度领先于GeForce GTX 480,Fermi架构在这代产品上终于没有遗憾,全部设计目标得以达成。
● Fermi经典特性之图形与计算并重
“CUDA Cores”是Fermi最基础的运算单元,将它的历史向上追溯首先是G80时代的统一着色单元(Unified Shader Model),我们在G80和GT200时代将它统称为流处理器(Stream Processor),再向上追溯可知,这个单元将Vertex Shader(顶点着色器)和Pixel Shader(像素着色器)合并而成。
|
理论上说“CUDA Cores”只是起了一个好听的名字,让人们更看重GPU通用计算的作用,实际上我们在图形领域还是将它视为普通的流处理器。但这背后透露出NVIDIA公司的另一种计划——面向并行计算领域设计一颗芯片,并使其具备图形运算能力,这颗芯片由众多的“CUDA Cores”组成,运算速度主要由“CUDA Cores”的数量和频率决定。
● Fermi经典特性之GPC区划设计
GF110图形架构核心,从硬件的块数称为图形处理团簇(GPC)。每个GPC包含一个光栅引擎和四个SM单元。GPC是GF110占主导地位的高层次的硬件模块。除了计算单元它还包括两个重要特点——分别是一个可升级的光栅引擎(Raster Engine)、Z-cull和一个带有属性提取和细分曲面的多边形引擎(Polymorph Engine)。
正如其名称所示,所有的GPC都集成了关键的图形处理单元。它包括顶点,几何,光栅,纹理均衡设置和像素处理资源。随着ROP单元功能的不断增强,一个GPC单元可以被看作是一个配置齐全的GPU,而GF110拥有4个这样的核心。
● Fermi经典特性之自适应可读写缓存
通过了解不同的成千上万的应用程序,NVIDIA工程师发现shared memory可以解决一部分程序的需求,但是不能解决所有的问题。一些应用程序天然需要shared memory,有些应用程序则需要缓存cache,有的既需要shared memory也需要cache。优化的内存设计可以既提供shared memory也提供cache,可以让程序员根据自己的需求来做选择。Fermi架构通过变化存储器的资源配置,可以同时支持这两种需求。
GF110的每一个SM中拥有64KB的可配置片上缓存,可以设置为48KB共享缓存加16KB L1缓存,也可以设置为16KB共享缓存加48KB L1缓存。在之前的GT200核心中,并没有L1缓存的设计。L1缓存可以用于处理寄存器溢出、堆栈操作和全局LD/ST。过去,GPU的寄存器如果发生溢出,会大幅度增加存取时延。
而Fermi的对手代号R800的HD5870所具备的cache是不可随便调用的,HD5870的缓存实际上是传统的Texture cache,只不过现在可以用来临时释放结果做LDS(Local Data Share),不可编程,不可操作,不可写,只读。所以R800现在是16KB LDS+16KB cache,也就是说专用LDS只有16KB。
● Fermi经典特性之线程调度
Fermi架构的另一个重要特性,就是它的双层分布式调度机制。在片上的层面(SPA Streaming Processor Array,流式处理器矩阵级别),全局的分布式线程调度引擎(global work distribution engine)分发block到每一个SM上,在SM层面,每一个warp分布式调度引擎按照32个线程为一个warp执行。
Fermi实现了SM级别的双发射,意味着SPMD(单线程多任务)的实现。从并行kernel下探到最底层,实际上就是靠的SM级别的双发射。SM级别的SPMD上升到GPU核心级别,Fermi就是MPMD(多线程多任务)。这种设计已经越来越像CPU,而且随着GPU的发展,每走一步,就多像一份。
第一代GigaThread线程调度引擎,在G80架构中实现了12288个线程的实时的调度管理。Fermi架构不只是增强了原有的机制,而且引进了更快的context上下文交换机制,并行kernel执行机制,增强了线程block的调度能力。Fermi的这项能力相对于上一代GPU提高了10倍。
同时像CPU一样,GPU也可以利用context上下文交换机制来管理多任务的切换,每一个任务都可以用分时的方式利用处理器的计算资源。Fermi的运算流水线经过优化设计,把context上下文的切换时间减少到了10到20毫秒,极大的优化了GPU架构。
● Windows7 SP1升级包特性分析
微软在2010年7月14日凌晨公开发布了Windows 7、Windows Server 2008 R2第一个SP升级服务包的Beta测试版本。这次SP1加入的新玩意不少,但最主要的两个特性全都是面向企业用户和IT管理员的。不过普通用户也可以通过升级SP1获得一些特性与性能提升,下面就让我们结合收集到的信息为大家简单讲解。
尽管微软官方对服务包给出了一定的说明,但并不完整,以下是科技博客作者玛瑞斯·欧依葛根据亲身体验,列举了一些安装使用Win 7 SP1时值得注意的要点:
1、Windows 7 SP1 beta中新增哪些功能特性?
很遗憾,本次服务包中除了Win 7 RTM包含的所有功能以及动态内存管理和RemoteFX技术外,没有在用户层面增加新的功能。但目前仅是测试版,不排除在后续版本中添加的可能。
2、Windows 7 SP1提供些什么?
该问题的回答很标准:SP1是为开发者和IT专业人士提供的,旨在改善操作系统的性能并提供现有升级补丁包,更好收集用户和合作伙伴的反馈信息。
3、安装SP1前要做哪些准备工作?
只有一点:Windows 7 RTM版操作系统,且测试版仅限五个语言版本分别是英语、法语、西班牙语、德语和日语。
4、Windows 7 SP1测试版的使用寿命是多久?
大约一年。到2011年3月底开始,微软会发出到期提示,并在6月30日终止支持服务。届时,旧的系统需要升级到更新的版本比如SP2、SP3等。
5、Windows 7 SP1 RTM(稳定版)能使用多久?
按照惯例,现有软件的稳定版至少可以在新版出现后延长24个月,折合两年的寿命。
6、Windows 7 SP1 RTM(稳定版)何时发布?
微软官方给出的时间大概是2011年第一季度。
7、SP1 beta的目标客户是哪些?
SP 1公开测试版是为IT专业人士和开发人员量身打造的,作为一款面试不足一年的操作系统,亟需这些用户开发出更多支持Windows 7的软件产品。SP1包括32/64两个版本,且SP1最终版将通过Windows更新服务提供安装。
8、SP1系统配置最低要求是什么?
最低需要1GHz以上处理器、1G(32位)/2G(64位)内存、16G/20G磁盘空间、支持WDDM 1.0以上版本的DirectX 9显卡。
9、SP1 beta能否升级到SP1 RTM?
不可以,用户需要卸载SP 1测试版后再净安装SP 1RTM,该服务可通过每周的Windows Update提供。
10、Vista SP1在市场中的反馈比较糟糕,我们是否应对Win 7SP1同样持警惕态度?
Windows 7与Vista不同,它具备很多旧版Windows的优点且入市半年多以来较少出现使用故障,兼容性、硬/软件支持、稳定性均十分出色,至少在目前来说是这样的,所以还是值得升级到SP1的。
● Windows 7 SP1专属变化与性能提升
1、支持第三方联合服务高效通信
也就是那些支持WS-Federation被动配置协议的,从而增强平台协作性、改进不同组织间的身份和授权信息认证能力。
2、改进HDMI音频设备性能
有些用户反映Windows 7 PC在系统重启后与HDMI音频设备之间的连接会消失。SP1对此做出了改进,确保二者的连接不再中断。
3、纠正打印混合方向XPS文档时的设置
部分用户反映使用XPS Viewer打印同时包含横向、竖向的XPS文档时存在困难,导致整个页面变成了要么全部横向、要么全部竖向的单一 模式。SP1已经解决了这一问题。
Win 7 SP1的独有特性还包括路由远程访问识别(RRAS和IPSec)的加强,这个特性对于网络管理员非常有帮助,但普通用户依然不会经常用到它们。
最后一个就是高级矢量扩展(Advanced Vector eXtensions)指令集的支持,这恐怕是Win 7 SP1对于广大群众最有用的一个升级了。AVX指令集是英特尔下一代处理器Sandy Bridge所支持的指令集,它能大大加强处理器的浮点计算能力,在一些浮点运算比较密集的程序(例如3D渲染,高清视频编码,3D游戏)中会获得显著的性能提升。
简单的说,如果某个程序、你的处理器、操作系统都支持AVX指令集,那么这个程序的运行速度就会快很多。Win 7 SP1的AVX指令集支持就是操作系统这一环。
通过上文分析大家已经了解了,Windows 7 SP1没有在用户层面增加任何新的功能,因为原版Win7已经很完美了,微软要做的只是加强安全性,提高兼容性。不过今天的测试还是充满悬念,我们测试的Geforce GTX460、GTX580、Radeon HD6870将会在SP1下展现出何种性能提升呢?
● 性能测试的硬件、软件平台状况
● 测试系统硬件环境
性能测试使用的硬件平台由Intel Core i7-870 3.5GHz、ASUS P7P55D Deluxe主板和2GB*2双通道DDR3-1600内存构成。细节及软件 环境设定见下表:
测 试 平 台 硬 件 | |
中央处理器 | Intel Core i7-870 OC3.5GHz |
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 ) | |
散热器 | Thermalright Ultra-120 eXtreme |
(单个120mm*25mm风扇 / 1600RPM) | |
内存模组 | Apacer 猎豹二代双通道套装/PC3-12800 |
(SPD:1757 9-9-9-24-1T) | |
主板 | ASUS P7P55D |
(Intel P55 + ICH10R Chipset) | |
显示卡 | |
AMD 产 品 | |
Radeon HD 6870 | |
(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 显存:4200 Mhz) | |
Radeon HD 5870 | |
(Cypress / 1024MB / 核心:850MHz / Shader:850Mhz / 显存:4800 Mhz) | |
Radeon HD 5850 | |
(Cypress / 1024MB / 核心:725MHz / Shader:725Mhz / 显存:4000 Mhz) | |
NVIDIA 产 品 | |
GeForce GTX 580 1536MB | |
(GF110 / 1536MB / 核心:772MHz / Shader:1544Mhz / 显存:4008Mhz) | |
GeForce GTX 480 1536MB | |
(GF100 / 1280MB / 核心:700MHz / Shader:1401Mhz / 显存:3696 Mhz) | |
GeForce GTX 460 1024MB | |
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz) | |
硬盘 | Hitachi 1T |
(1TB / 7200RPM / 16M缓存 / 50GB NTFS系统分区) | |
电源供应器 | AcBel R8 ATX-700CA-AB8FB |
(ATX12V 2.0 / 700W) | |
显示器 | DELL UltraSharp U2410 |
(24英寸LCD / 1920*1200分辨率) |
Apacer 猎豹二代双通道套装/PC3-12800
AcBel R8 ATX-700CA-AB8FB
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组、电源供应器、CPU散热器均由COOLIFE玩家国度俱乐部提供,COOLIFE玩家国度俱乐部是华硕(ASUS)玩家国度官方店、英特尔(Intel)至尊地带旗舰店和芝奇(G.SKILL)北京旗舰店,同时也是康舒(AcBel)和利民(Thermalright)的北京总代理。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 | Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.10) | |
NVIDIA Forceware for Win7 | |
(WHQL / 版本号 262.99) | |
桌面环境 | 2560*1600_32bit 60Hz |
测 试 平 台 软 件 | |
3D合成 测试软件 | |
3Dmark Vantage | |
Futuremark / 版本号1.2 | |
DirectX 11 理论测试项目 | DirectX 11 SDK Nbody Gravity |
Microsoft / 版本号 Demo | |
HDRToneMapping CS11 | |
Microsoft / 版本号 Demo | |
OIT 11 | |
Microsoft / 版本号 Demo | |
MultiThreadedRendering11 | |
Microsoft / 版本号 Demo | |
基准性能测试 | GPCBenchMarkOCL |
HPC Tech / 版本号1.1 | |
辅助测试软件 | Fraps |
beepa / 版本号 3.2.3 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
● DX10理论性能测试:3Dmark Vantage特性测试 3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。 我们本次测试使用了3DmarkVantage的6个子项测试,这些子项可以很好地体现GPU的图形处理特性,也可以发现不同GPU架构对于不同渲染场景的适应性。
● DirectX 11 SDK Nbody Gravity
DirectX 11 SDK Nbody Gravity项目源于Nbody仿真,它在数值上近似地表示一个多体系统的演化过程,该系统中的一个体(Body)都持续地与所有其他的体相互作用。一个相似的例子是天体物理学仿真,在该仿真中,每个体代表一个星系或者一个独立运行的星系,各个体之间通过万有引力相互吸引,如图所示。
在很多其他计算机科学问题中也会用到N-body仿真,例如蛋白质折叠就用到Nbody仿真计算静电荷范德华力。其他使用N-body仿真的例子还有湍流流场仿真与全局光照计算等计算机图形学中的问题。
● HDRToneMapping CS11
HDRToneMapping CS11测试项目同样是针对Computer Shader能力进行测试,该项目展示了如何设置和运行计算着色器(Computer Shader),这是最令人兴奋的Direct3D 11的新功能之一。虽然该测试只是检验了这项技术在HDR(High-Dynamic Range)高动态光照渲染中的加速能力,但是这个概念应该很容易扩展到其他后处理算法,以及更一般的计算。
这项测试我们选择了DirectX 11所推荐的Computer Shader渲染模式,在测试中NVIDIA显卡出现了负载不饱和状态,所以整体得分不理想。联系到NVIDIA在Fermi架构中对并行计算的支持和多级多分配多线程能力,这个得分还是比较让人失望的,我们只能希望NVIDIA通过新驱动开发继续优化带有缓存的Fermi架构。
● OIT11次序无关透明
OIT11示例演示了在Direct3D 11独立透明度的技术。换句话说,基元(Primitives),可以得出在任何秩序,透明度将正确处理。该技术提供的作品,因为它们是由缓冲透明的像素。这些像素,然后按深度,并在后端到前端与tranparency秩序呈现。本示例使用计算着色器生成一个前缀之和排序前最后的渲染的像素片段。
● MultiThreadedRendering11单线程
MultiThreadedRendering11项目是一个典型的多线程渲染测试,此示例说明了如何提升多线程环境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,拥有一个驻留在D3D设备的新接口,称为D3D设备上下文。
D3D设备上下文可以完成两种效果之一:立即或延迟。一个直接的上下文命令直接提交到设备驱动程序,如传统的渲染。递延范围内分批为在命令列入名单的命令,该命令列表可以执行在任何时候通过一个即时的范围内,可能在不同的线程运行。
第一部分的测试使用了单线程模式,线程数量可以在程序中自动控制。我们通过监控任务管理器看到单线程模式下,一颗4核心CPU的占用率大约在25%。也就是说只有一个CPU核心带领GPU执行渲染任务,这是以往DirectX的渲染模式。
● MultiThreadedRendering11多线程
MultiThreadedRendering11项目是一个典型的多线程渲染测试,此示例说明了如何提升多线程环境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,拥有一个驻留在D3D设备的新接口,称为D3D设备上下文。
D3D设备上下文可以完成两种效果之一:立即或延迟。一个直接的上下文命令直接提交到设备驱动程序,如传统的渲染。递延范围内分批为在命令列入名单的命令,该命令列表可以执行在任何时候通过一个即时的范围内,可能在不同的线程运行。
第二次测试我们开启了多线程渲染模式,我们看到CPU占用率提升到了50%左右,其中一颗核心负载将近100%,其他核心负载也相应有所提升。
● Win7 SP1测试之多线程渲染
MultiThreadedRendering11项目是一个典型的多线程渲染测试,此示例说明了如何提升多线程环境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,拥有一个驻留在D3D设备的新接口,称为D3D设备上下文。
D3D设备上下文可以完成两种效果之一:立即或延迟。一个直接的上下文命令直接提交到设备驱动程序,如传统的渲染。递延范围内分批为在命令列入名单的命令,该命令列表可以执行在任何时候通过一个即时的范围内,可能在不同的线程运行。
测试总结:
通过本次测试我们了解到了Geforce GTX580的各项特性,在确认半导体工艺能够稳定支撑全规格的Fermi架构之后,NVIDIA提高频率并且补全规格,这就是现在展现在我们面前的Geforce GTX580。
微软此次放出的Win7 SP1虽然旨在提升安全性和兼容性,但我们在性能测试中还是找到了一些难得的提升,特别是在GF104核心的Geforce GTX460产品多线程渲染测试部分,我们发现全新的升级包带来了可观的性能增益。