新浪科技

74项严刑拷打 英特尔酷睿i7性能详细解析(27)

中关村在线

关注

● Tock年来到 酷睿2升级酷睿i7

2006年,Intel发布名为酷睿2的Core架构处理器,随后,Tick-Tock计划启动。

2007年,Tick年,Intel于11月份正式发布首款采用45纳米制程的处理器——Core 2 Extreme QX9650。

2008年,Tock年,Intel将于11月中旬正式发布新一代的微架构处理器——Core i7(研发代号:Nehalem)……

为什么叫i7?互联网上有一种比较有意思的解释:从Pentium 4开始,到后来的Pentium D、Core 2 Duo,i7刚好是第七代产品。虽然Intel官方并没有对这种猜测进行回应,但我们相信这其中必有原因。

时钟开始倒计时,距离Core i7正式发布的时间已经不足1个月,相对于上一代酷睿2处理器,它有哪些性能方面的提升?


全  文  导  航
序言Intel Tock年来到 酷睿2升级酷睿i7
第一章制程和架构 CPU性能提升2大法宝
第二章酷睿 i7基本特性详解改变1:从LGA 775到LGA 1366
改变2:QPI总线取代FSB
改变3:3通道DDR3内存控制器
改变4:缓存架构面目全非
改变5:恐怖的8线程设计
改变6:动态超频Turbo技术
新旗舰:X58 Express详解
Intel 原厂DX58SO解析
测试平台:SSD+GTX280上阵
第三章DIY理论性能测试基准测试:SYSmark 2007
基准测试:PCmark Vantage
科学运算:ScienceMark 2.0
内存效能:Everest Ultimate
Everest Ultimate:CPU性能
运算性能 & 多媒体指令集测试
应用测试Fritz & WinRAR
本章小结
第四章多媒体应用测试图形渲染:POV-Ray
图形渲染:CINEBENCH R10
视频处理:DivX 6.8
视频处理:TMPGEnc
视频处理:H.264 Encoder
本章小结
第五章3D游戏性能测试理论测试:3Dmark 06
理论测试:3Dmark Vantage
DX9游戏测试:Quake4
DX9游戏测试:Half Life 2 EP2
DX10游戏测试:Crysis WARHEAD
DX10游戏测试:Call of Juarez
DX10游戏测试:英雄连1.71
DX10游戏测试:World in Conflict
本章小结
第六章能耗测试 最高仅提升7%
总结及评价性能总体评价:多方面压倒性优势
市场及展望:成功接替上代旗舰

● 制程和架构 CPU性能提升两大法宝

众所周知,排除时钟频率的差异,从根本上提升处理器性能的途径有两个:



基于45纳米制程的双核心Core架构处理器内核图

1、更新制程。制造工艺的改进理论上可以带来功耗的降低,使得产品的默认时钟频率可以更高,直接提升性能。同时如果在更新制造工艺的同时对微架构进行细微的调整,那么产品的性能也会得到提升。45纳米的酷睿2处理器就是一个典型的例子。


基于Nehalem架构的Core i7架构透视图

2、更新微架构。从奔腾4时代的NetBurst切换到Core架构后的Intel,一举击败了曾经风光一时的K8架构,帮助Intel重新登上性能王宝座。Core i7虽然商标名称仍然为酷睿,但产品的架构已经从Core更新为Nehalem,并且仍然采用高-K材料设计的45纳米制程打造,因此在性能上的表现值得期待。关于45纳米制程,我们之前已经进行了大量的介绍,因此在进入测试环节之前,我们还需重点对Nehalem架构进行介绍。

● LGA 775散热器全废 Nehalem针脚有变化

自Intel“9”系列主板芯片组开始,CPU针脚被移植到了主板上,改为触点式封装的LGA 775处理器可以非常有效地避免在运输过程中出现损伤。Core架构发布以后,这种封装方式被延续下来,而所有酷睿2处理器也采用LGA 775阵脚,与上一代的奔腾4、奔腾D接口完全兼容。但到了Nehalem架构虽然也延续了触点式封装,但却将产品的针脚更改为LGA 1366和LGA 1160(不久前有传言又改为LGA 1156),其中LGA 1366处理器面积由原来的37.5mm*37.5mm提升为42.5mm*45mm。


Core i7 Extreme 965与QX9770背面对比

代号为Bloomfield的四核心Core i7处理器全部产品会采用LGA 1366封装,针对主流市场的桌面级四核心处理器Lynnfield以及Cleaksfield将会采用LGA 1160(也可能是LGA 1156),而未来整合GPU功能的代号为Havendale的桌面双核产品则将在更晚时候发布,同样采用LGA 1160封装,不过接口定义可能与Lynnfield有些不同,因此可能相关主板不会兼容。


LGA 775扣具的散热器无法再兼容新的平台

采用LGA 1366和LGA 1160(LGA 1156)接口后,主板的孔距直接提升为80mm和75mm,因此LGA 775平台的散热器无法兼容最新平台,虽然这种设计为主板及散热器厂商带来了一些麻烦,但通过接口的差异化设计,Intel将顶级玩家与主流用户直接分离出来,一定程度上有助于后续服务的针对性进行。

● 为何只有133外频? QPI总线替代FSB

由于采用了全新的微架构设计,Core i7的规格相比以前有了大幅度改变。其首批上市的型号中最高端的Extreme 965主频达到3.2GHz,与上代产品QX9770持平,但却采用了133MHz*24这种低外频、高倍频的设计,与QX9770 400MHz*8的方式完全不同。我们知道,依赖于FSB总线传输,Intel 奔腾4、酷睿2 处理器都非常依赖处理器外频,为何这次的旗舰级产品外频却只有133MHz呢?



Core i7 Extreme 965 CPU-Z规格:超低外频*高倍频设计

因为Nehalem架构采用了全新的QPI总线。随着处理器核心数量的增多,继续公用一条FSB总线显然已经力不从心,为了改变FSB的瓶颈,Intel Nehalem架构采用了类似于Hyper-Transport总线的全新数据传输总线Quick Path Interconnect,让其与内存直接交换数据。QPI总线的连接方式更加灵活,它可以将处理器的每颗核心分割为独立的小块,每个核心之间也可以通过QPI总线进行连接,根据市场定位,QPI总线的条数会进行调整。目前桌面级CPU的QPI总线为1条,但服务器级别的Nehalem处理器则会配备2条甚至4条QPI连接,因此QPI总线的引入让Intel在服务器领域的竞争力大大加强。


Nehalem QPI架构设计示意图

与竞争对手相比,Intel桌面级处理器的QPI总线频率最高可达6.4GT/s,即使是定位非旗舰的Core i7 920和940,也具备4.8GT/s频率。QPI每个方向的的位宽可以为5、10、20bit,因此每个方向的QPI连接宽度可提供12-16GB/s带宽,这样一来一条QPI连接的带宽可以达到24-32GB/s。

第一批Nehalem处理器使用了20bit的连接位宽,提供了大约25.6GB/s的数据传输能力,从理论上超越了竞争对手所采用的HyperTransport 3.0。QPI总线的引入也使得Intel可以更加保守地设定处理器外频,将巨大的超频空间留给玩家,因为即便是小幅度的外频提升也会让CPU的时钟频率得到飞跃!

● CPU直接控制内存 IMC工作原理解析

讲到QPI总线就不得不谈谈Nehalem处理器的内存控制器。内存控制器(integrated memory controller)简称IMC,由于Core i7通过QPI直接与内存交换数据,因此CPU内部就必须集成一个控制内存的部门。首批上市的Core i7内存控制器支持3通道DDR3内存规格,彻底抛弃DDR2。其三通道内存默认运行在DDR3-1066,也可以很容易地运行在DDR3-1333,以达到32GB/s的峰值带宽。通过内存控制器设计,Nehalem处理器达到了酷睿2处理器的4倍内存带宽,使得每个核心可以支持最大10个未解决的数据缓存命中失败和总共16个命中失败,比酷睿2的单核心8个总共14个提高了不少。



内存控制器架构图

内存控制器和QPI总线的结合工作,令数据延迟大大降低,直接的表现就是我们在运行大型软件或大型3D游戏时的数据加载时间大大减少,这对无法忍耐长时间数据加载的玩家确实是一个利好消息。


玩Core i7 并非一定要插3条或6条内存

另外,值得一提的是,虽然Core i7处理器是集成3通道DDR3内存控制器,但并不表示我们必须搭配3条内存或6条内存来组建3通道系统才可以发挥其威力,笔者曾尝试过采用2条内存测试,结果表明在装载2条内存的情况下Core i7可以开启双通道模式,虽然与3通道相比在性能上有所损失,不过对部分用户来说这的确是个更为经济的解决方案,因为就目前的32bit操作系统下,使用2GB以上内存并不会带来突飞猛进的性能提升。

● 8MB L3 Cache引入 Core i7缓存架构面目全非

Nehalem处理器的缓存架构相对于之前的奔腾4、酷睿2产品,也有了较大的变化。随着45纳米制程的引入,酷睿2处理器的最大L2缓存已经达到12MB,类似于FSB,继续无休止地提升L2缓存并不一定能带来明显的效能改善,因此在Core i7上,我们看到了一个全新的缓存架构。



依赖二级缓存的时代已经过去

从Core i7的缓存架构示意图可以看出,它选用了共享L3缓存的方式来暂存数据。桌面级四核心处理器的产品动用了8MB L3缓存。4个核心除了分享8MB L3缓存外,每颗核心还单独具备256KB的L2缓存,另外还为每颗核心配备了与Core架构极为类似的64KB L1缓存。

这里必须说一下缓存延迟问题。45纳米酷睿2处理器的L2缓存延迟周期为15,而Intel工程师表示Nehalem架构的L3缓存可以达到30-40周期,不过每颗核心独立拥有的通用L2缓存周期只有12,因此L3带来的高延迟问题一定程度上由L2进行了弥补。另一方面,4颗核心共享L3缓存,在数据命中失败后可直接重新从内存寻找数据,而不是在缓存中重新进行侦测。Intel称Nehalem上的L3缓存为Smart Cache,相比也是因为这些原因。

● 重新启用超线程 恐怖8线程设计

Nehalem架构还重新启用了曾经在NetBurst上应用过的超线程技术,不过已经更名为同步多线程技术(Simultaneous Multi-Threading,SMT)。我们知道,NetBurst架构上的超线程技术局限于FSB和内存传输数据带宽,实际带来的性能提升可能并不明显,因此后来的酷睿2处理器直接抛弃了超线程技术。但这次Nehalem架构将QPI和集成内存控制器引入后直接带来惊人的带宽,重新启动同步多线程技术毫无疑问不用再担心传输带宽所产生的瓶颈。



Core i7处理器具备恐怖的8个逻辑计算单元(点击放大)

Nehalem架构所采用的同步多线程技术基于2路设计,即每颗核心可以同时执行2个线程。在多任务情况下可以有效提升性能,采用这种模拟的逻辑运算核心绝对比直接增加一颗物理运算核心成本低。Intel表示SMT技术可以在能耗增加不明显的情况下提升20-30%性能。

● 动态超频? Turbo技术简介

首批发布的Nehalem Core i7处理器TDP为130W,在这个TDP设定范围内用户可以开启一种名为Turbo的技术来提升CPU在某些应用中的时钟频率。例如在大型3D游戏中,可能多核心并不能带来明显的效能提升,对处理器进行超频反而效果更好,如果这个时候开启Turbo模式,并且将TDP设定在用户所采用的散热器允许范围内,那么CPU在这个时侯可以对某颗或某两颗核心进行动态超频来提升性能。


Nehalem架构中的Turbo模式带来全新体验

实现Turbo技术需要在核心内部设计一个功率控制器,大约需要消耗100万个晶体管。但这个代价是值得的,因为在某些游戏中开启Turbo模式可以直接带来10%左右的性能提升,相当于将显卡提升一个档次。值得一提的是,Extreme版本的Core i7处理器最高可以将TDP在BIOS中设定到190W来执行Turbo模式,在个别应用中进一步提升CPU时钟频率,带来效能上的提升。

● X58芯片组 LGA 1366的专属

为了细分市场,Nehalem架构的Core i7处理器采用了3种不同的阵脚封装模式,Intel将高端的四核心产品设定为LGA 1366,其配套的主板芯片组当之无愧地采用了“X”系列,即代号为Tylersburg的X58 Express。



Intel X58 Express芯片组规格

Intel X58 Express基于LGA 1366的Bloomfield Nehalem微架构处理器设计,搭配ICH10R南桥。由于Nehalem处理器开始集成内存控制器,因此X58 Express主板芯片组支持3通道DDR3内存规格。另一方面,主板北桥芯片集成32条PCI-Express通道,可以实现双16X的SLI(需NVIDIA官方验证或外挂NF200芯片实现)、CrossFire功能,并且可以拆分为4条8X通道,实现3卡SLI或者4路CrossFire功能,大幅度提升3D游戏性能。


Intel X58 Express Chipset北桥芯片特写

目前,微星、华硕、技嘉、富士康、精英等台系传统大厂已经陆续拿出了各自的X58 Express主板,本土品牌翔升也有相关产品开发,而Intel原厂X58也在早些时候送达了中关村在线,并且都通过NVIDIA授权加入了对SLI的支持。NVIDIA对每款X58授权的费用是5美金,而板载NF200芯片实现SLI则需要至少30美金的芯片费用,因此ZOL收到的首批X58主板统统采用了授权支持这种更为经济的方案。

与ODM合作伙伴的X58所不同的是,首款问世的代号为DX58SO的原厂X58主板并不支持SLI功能,也许在后续的产品中Intel原厂X58的SLI功能才会被开启。接下来我们将会对Intel原厂X58进行详细解析。

● 用料豪华不输一线 原厂X58详解

一直以来,Intel在旗舰级芯片组主板的做工、用料及超频能力就不输给台系大厂,当然这主要还是由于其旗舰级芯片的定位决定的。DX58SO的整体布局相对于以前的产品有了大幅度的改观,其内存插槽和北桥芯片的位置设计显然是为了更加贴近Core i7处理器的特点进行了重新布线,以求带来更好的信号和更低的干扰。另外值得一提的是,目前我们所接触的X58主板基本都没有加载第三方的NF200芯片来实现SLI,而是采用NVIDIA官方授权Key的方式实现。Intel对其解释是可以减少成本,另外还能避免加载第三方芯片带来的延迟。


8层PCB设计,黑色板型,毫无疑问Intel原厂的DX58SO是一款定位于旗舰的产品。主板搭配ICH10R南桥,提供首批LGA 1366接口Core i7处理器的最佳解决方案。


异常豪华的供电设计

 
PULSE电感及ADP4000控制芯片

主板CPU供电部分使用了一颗原生6相位PWM控制芯片ADP4000,支持VRD11.1规范,同时搭配大量来自日本化工和富士通的日系固态电容,电感方面,ATI旗舰级显卡上常见的PULSE被应用了上来,可以说这款主板的CPU供电不惜成本。同时为了解决处理器超频后供电部分发热问题,主板还在MOSFET上加装了铝制散热片,虽然没有传统的一体化热管式设计豪华,但满足实用超频后的散热需求已经是绰绰有余。

 
北桥供电及散热

虽然将内存控制器集成到CPU内部可以令北桥的负载降低,但Intel X58北桥芯片的供电设计同样一丝不苟,另外,原厂的X58还提供了一款AVC代工的主动式散热风扇。


DIMM内存插槽

Intel DX58SO主板配备了4条DIMM内存插槽,3条蓝色的插槽支持3通道内存规格,这与大量ODM产品所用的6条插槽的解决方案相比显得更加实用,因为就目前的操作系统来看,3GB(1GB*3)或者是6GB(2GB*3)的搭配方案已经足矣,将插槽缩减可以减少布线难度。而将内存插槽设计在主板最北端,更加贴近CPU,一定程度上还能减少线路的干扰和延迟。


主板搭配ICH10R南桥

X58 Express统一搭配ICH10R南桥,原厂X58提供6组SATA磁盘接口,可以支持RAID-0、1、5、0+1等多种磁盘阵列模式,由于没有加载JMB363之类的芯片,因此这款主板上不存在IDE磁盘接口和软驱接口,看来Intel将IDE淘汰的行动首先还是从自己开始做起了。


扩展插槽

原厂X58主板提供2个PCI-E X16 2.0显卡插槽,可以支持双16X模式的CrossFire,另外,它还提供了1条开放式的PCI-E X4插槽、2条PCI-E X1插槽和一条PCI插槽,扩展能力不错。

 
音频及网络芯片

DX58SO采用ALC889 HD音频芯片,提供7.1声道的支持,信噪比达到110,网络芯片则采用了WG82567LM,可提供千兆网络传输功能。


I/O接口

主板的I/O接口端提供了2组e-SATA磁盘接口、8组USB 2.0接口、1组千兆网络接口和1组IEEE 1394接口。另外,主板还提供了光纤输出接口和音频输入、输出接口。

● GTX 280+SSD上阵 测试平台及相关介绍

本次测试将采用Intel Core i7 Extreme 965处理器,搭配原厂X58主板。内存方面我们将首次组建3通道系统,为了消除瓶颈,我们会采用SSD硬盘以及GTX280显卡作为测试平台。测试将在Windows Vista Ultimate下进行,详细的硬件设定及规格请参见下表:


系 统 硬 件 环 境
中央处理器Intel Core i7 Extreme 965
(四核八线程/133MHz×24主频  / 256KB×4 L2缓存 / 8MB共享L3缓存)
Intel Core 2 Extreme QX9770
(四核/400MHz×8 / 12MB共享L2缓存)
CPU散热器九州风神 黑虎鲸 LGA 1160&1366
猫头鹰 NH-C12P LGA 775
内存模组Kingston HyperX
(Run:DDR3 1066 @ 7-7-7-20-1T)
主板Intel DX58SO LGA 1366
(Intel X58+ICH10R)
ASUS Rampage Extreme LGA 775
(Intel X48+ICH9R)
显示卡MSI M280GTX-T2D1G-OC
(核心/着色器/显存频率700MHz /1400MHz/2300MHz)
硬盘Intel X25-M SATA SSD
(80GB / MLC / 16MB缓存 / NTFS系统分区)
电源供应器Thermaltake Toughpower 1500W
( ATX 2.3 / 1500W额定功率 )
显示器DELL 3007 WFP
(30英寸宽屏液晶 2560×1600 @ 60Hz)
功率负载仪Seasonic Power Angel



测试平台一览

本次测试特别感谢金士顿提供HyperX DDR3 3通道内存套装、九州风神提供最新的LGA 1160/1366版黑虎鲸散热器。我们的测试环节分为3个章节,分别考察DIY理论性能、视频编码及转码性能和3D游戏性能。测试软件及相关信息请参见下表:

测 试 软 件 及 相 关 介 绍
性能测试软件
DIY理论性能测试BAPCo SYSmark 2007 Preview
BAPCo / 版本号:1.04.670
PCmark Vantage
Futuremark / 版本号:1.0
ScienceMark
AlexanderGoodrich, B.S. /  版本号:2.0
Fritz Chess Benchmark
ChessBase GmbH / Fritz 10 OCT 24 2006
WinRAR
版本号:3.71
Everest Ultimate
Lavalys / 版本号:4.60.1500
SiSoftware Sandra
SiSoftware / 版本号:2009
多媒体应用测试CINEBENCH
MAXON / 版本号R10
POV-Ray
 Persistence of Vision / 版本号3.7.0
 H.264 Encoder
MainConcept / 版本号:2.01
TMPEGEnc 4.0 Xpress
Pegasys Inc. / 版本号:4.4.2.238
DivX Converter
DivX ,Inc. / 版本号:6.8
3D游戏及相关软件
Quake 4
id Software / 版本:1.4.1
Half Life 2 Episode 2
VALVE / 版本号:1.0.0.0
Crysis WARHEAD
Crytek / 版本号:1.0
Company of Hearoes
Relic / 版本号:1.71
World in Conflict
Sierra / 版本号:1.0.0.0
Call of Juarez
Ubisoft / 版本号1.0
 其他
系统信息获取CPU-Z
www.cpuid.com / 版本号1.48

接下来我们将从DIY理论性能开始,全方位测试Core i7处理器的性能。

● 最高提升12% SYSmark 2007性能揭秘

SYSmark 2007 Preview是由BAPCo(英文全名Business Applications Performance Corporation,中文名为“商业应用性能公司”)组织推出的一款系统综合性能评估软件。BAPCo组织成立于1995年,是一家领先全球的非盈利性工业出版组织,其成员包括PC硬件厂商、第三方硬件性能评估机构、软件出版商以及半导体制造商。目前BAPCo组织一共有16个成员,其中包括AMD、Apple、ARCintuition、Atheros Communications、CNET、Compal Electronics、Dell、Hewlett-Packard、Intel、Lenovo、Microsoft、NVIDIA、Toshiba、VNU Business Publications Limited(UK)、ZDNet以及Ziff Davis Media。这个组织除了推出权威的SYSmark系列外,还推出了MobileMark,这款软件在笔记本电脑性能测试中十分常见。


Core i7 Extreme 965相对于上代旗舰QX9770,在SYSmark 2007总成绩上提升了4%,总分达到惊人的200分。在3D建模子项目中,Core i7一举将差距拉大到了12%。不过Core i7在办公生产力和电子学习子项目中表现失常,竟然被QX9770反超。

● 理论游戏性能提升23.5% PCmark测试

来自Futuremark的PCmark系列测试软件与SYSmark系列相比,更加偏重于娱乐应用。针对Windows Vista操作系统,PCmark也从2005升级到了Vantage,全新的PCmark Vantage不仅包括系统总分,而且还包含了Memories(内存)、TV and Movies(视频)、Gaming(游戏)、Music(音乐)以及Communications(通信)和Productivity(生产力)。接下来是Core i7在PCmark Vantage中的表现:


PCmark Vantage总分相对于上代旗舰提升了9%性能。与SYSmark 2007结果有些相似的是在Gaming子项目测试中Core i7的优势非常明显,达到了23.5%,但在办公生产力上再次表现出不足之处。当然,这种理论的非正常现象还需要后续的实践来证明。

● 内存控制器发飙 ScienceMark测试

接下来要进行的是ScienceMark的测试,我们选用的是2.0版本。这是一款通过一些科学方程式来测试系统性能的软件。它主要针对台式机和工作站内存子系统,对于增加了内存控制器的Core i7来说,这款软件理所应但反映出内存传输带宽增大后带来的变化。


从总分来看,也许Core i7 Extreme 965相对于上代顶级的QX9770没有太明显的得分提升,但是我们看看内存子项目就能够发现i7带来的性能飞跃。3023.53比1951.02,性能提升幅度达到了55%,Core i7的内存控制器在本论测试中终于开始发飙。

● 性能提升121% Everest内存子项目测试

虽然在前面的SYSmark 2007和PCmark Vantage测试中Core i7的得分有些时常,但真正能够对PC内存效能进行有效考察的还是著名的Everest。我们选用了Ultimate 4.60.1500版本,分别测试内存读取、写入、复制、延迟各项性能。


Core i7所在平台执行效率惊人!在内存复制自项目中领先上一代产品121%,三通道+集成内存控制器彻底将DDR3内存的高带宽优势释放出来。要知道我们仅仅是在DDR3-1066下完成了测试,其实在更高内存频率下,Core i7的内存读取已经超过2GB/s。另外,内存延迟测试结果也十分惊人,37.3ns的延迟即便是连以内存延迟低著称的K8平台也望尘莫及。

● 全面提升 Everest CPU性能测试

Everest除了可以对内存理论性能进行全面考察外,还可以对CPU的计算效能进行全面考察。它提供了7大测试项目,分别为:

CPU Queen——测试CPU的分支预测能力,以及预测错误时所造成的效能影响。
CPU PhotoWorxx——著重于CPU的整数运算能力,利用模拟数位影像处理来进行CPU效能的评估。
CPU ZLib——另一项针对CPU整数运算的测试,利用Zlib这个压缩函式库,来计算CPU在处理压缩档案时的能力。
CPU AES——一种加密计算测试。
FPU Julia——利用朱利亚碎形几何运算,来评估CPU的单精度(32bit)浮点运算能力。
FPU Mandel——利用了“Mandelbrot”碎形几何运算,来评估CPU的倍精度(64bit)运算能力。
FPU SinJulia——利用修改过的朱利亚碎形运算,来评估CPU的延伸精度(80bit)浮点运算能力。


即便是针对CPU的纯理论测试,我们也可以看出Core i7在各项性能测试中体现出的王者霸气。CPU Zlib(主要考察整数运算性能)测试直接提升30.1%,另外3个FPU浮点运算的测试中Core i7也能分别领先上代旗舰15%、26%、89.5%!

● SiSoftware Sandra运算性能及多媒体指令集测试

SiSoftware Sandra是一项非常重要的PC性能衡量软件。不久前它推出了2009版本,增加了对多核心、多线程处理器的支持,让我们可以更好地用它来考察PC的总体性能。这里将测试CPU的基本运算能力和多媒体指令集效能:


从基准运算性能的测试来看,无论是整数运算还是浮点运算,Core i7相对于上一代产品都有了飞跃性的性能提升。其浮点、整数运算性能分别提升54%和47.9%。

由于加入SSE4.2多媒体指令集,因此Core i7处理器在关于多媒体指令集的测试项目中同样表象非常出色,不管是Float还是Int都能够领先QX9770所在平台不小。

● 运算性能测试 Fritz 10&WinRAR

SYSmark 2007、PCmark Vantage、ScienceMark 2.0、SiSoftware Sandra以及Everest等测试项目也许过于理论化,那么接下来我们来看看两款实际应用软件中Core i7的效能表现。Fritz是一款国际象棋软件,它在x86架构PC上实现了当年IBM深蓝所做的关于国际象棋的预测和计算。虽然当前的PC与IBM深蓝并不能相提并论,但至少通过这个运算我们能够从主观上对一台PC,特别是CPU的运算效能有一个认识。Fritz系列软件给出了一个基准参数,就是在P3 1.0G处理器下,其可以每秒运算48万步。


由于是8线程同时运算,再加上Core i7在架构上进行了变化,因此在Fritz 10的测试中Core i7 Extreme 965领先上代产品达到了29.5%。

WinRAR几乎是每台PC必装的一款软件。其自带的Benchmark测试能够反映出CPU的文件压缩及解压缩处理能力。这款软件对内存带宽的吞吐非常敏感,一直以来集成内存控制器的处理器在这款软件应用中具备先天优势。

测试结果不出所料,Core i7一度领先四核心酷睿2 处理器,幅度高达69%,想想在解压缩和压缩应用中,如果您装载了一套拥有Core i7处理器系统的PC,性能将比前一代顶级产品提升69%,是多么美妙的一件事。

小结:

DIY理论性能的测试环节结束。从各项软件的测试结果来看,Core i7在包括CPU理论运算能力、内存执行效率、3D Game等多方面相对于上一代Core架构的四核心酷睿2处理器有了大幅度的性能提升。特别是引入的内存控制器充分发挥了DDR3内存以及3通道巨大的效能,这一点也许在家用桌面级平台上体现并不明显,但在对服务器系统的性能提升是革命性的。

● 多媒体性能测试:POV-Ray&CINEBENCH

刚刚针对CPU的基准性能及运算能力进行了众多理论性的测试,现在我们转入对多媒体应用的性能测试章节。本章节重点考察Core i7相对于上一代旗舰产品QX9770在图形渲染、视频编码及转码效能。

Core i7相对于第一代45nm处理器,增加了SSE4.2指令集,组成了完整的SSE4指令集。SSE4.2指令集包含7条指令,主要针对文本应用及上网进行优化,配合之前的SSE4.1指令集,Core i7在日常生活中常用的软件中将得到突飞猛进的效能提升。

另外,由于超线程技术的回归(Core i7中这项技术更名为Simultaneous Multi-Threading,简称SMT),Core i7处理器在图形渲染及视频处理等较为依赖运算核心的应用中将占据绝对优势。


从两款图形渲染应用的测试结果看来,SMT技术确实能够给我们的应用带来非凡的体验。POV-Ray打开SMT后可以带来61%的性能提升,而CINEBENCH R10中则至少能够带来24%的攀升幅度。

● 多线程发威 视频编码及转码测试

随45纳米制程诞生的SSE4.1指令集让CPU的视频处理能力直接提升70%,而这次加入的SSE4.2指令集虽然在视频方面并未进行过多优化,但由于SMT带来的8线程优势,我们同样期待它的表现。本次选用了DivX 6.8、TMPGEnc、H.264 Encoder三款常用的视频编辑软件进行测试。


在8线程的巨大优势下,Core i7在TMPGEnc中可以最大提升41%的性能,而在DivX 6.8和H.264 Encoder中,QX9770有较好表现,但与Core i7相比还是落后了不少,分别为12%和29%。

本章小结:

从本章的测试结果可以看出,由于具备SMT技术,打开8线程的Core i7处理器与上一代顶级的4核心处理器相比,无论是在图形渲染还是视频转码和编码中都能够大大提升执行效能。对于多媒体工作者来说,如果您天天面对的是海量的图形处理、大量的视频压缩,那么花钱购置一套Core i7的平台似乎对工作效率的提升大有帮助。

● 玩家盛宴 游戏应用测试之3Dmark 06

除了变态的多媒体专业应用,目前对PC效能要求最高的恐怕当属大型3D游戏了。本章节我们将重点考察Core i7在不同类型游戏中的执行效率以及3Dmark理论性能。虽说对游戏的流畅程度影响最大的是显卡,但CPU对游戏中的人工智能和物理加速支持是不可忽视的,因为有了这些,我们才能够获得逼真的游戏效果。


首先我们采用3Dmark 06来进行测试,测试分为默认分辨率(1280*1024)和最高分辨率(2560*1600),测试时关闭AA、AF,最后选取总分和CPU子项目成绩。通过对比我们发现,Core i7相对于上一代产品大致能够在3Dmark 06中提升8%-14%的性能。不过8线程的优势在这款软件中并没有很好地体现出来。

● CPU子项提升明显 3Dmark Vantage测试

针对Windows Vista系统推出的3Dmark Vantage将CPU和GPU的测试得分单独计算,因此更能够看出不同平台配备下CPU性能的差异化。我们将在Performance和Extreme两种模式下对整套平台进行测试:


很显然,Vantage版本的3Dmark更能够凸显Core i7的线程优势。虽然在总分表现上两套平台相差无极,但51.6%的CPU子项目差距足以说明多线程处理器在未来游戏中的将起到至关重要的作用。

● 经典DX9游戏 Quake4&HL2

接下来进行实际的游戏测试环节。首先是2款比较经典的DirectX 9游戏:Quake4以及Half Life 2 EP2。测试画面设定最高,但统一关闭AA和AF。


Core i7 Extreme 965在本论测试中表现失常,与之前的PCmark Vantage、SYSmark 2007的理论性测试不太一致。这可能是因为游戏年代较久,直接导致Core i7的多线程优势不明显,另外游戏在开发时Core i7并未诞生,因此Core i7的表现市场也是能够理解的。

● DX10游戏测试 Crysis&狂野西部

我们再来看看两套平台在DirectX 10游戏中的表现。经过2代产品的更迭,目前的主流DirectX 10显卡在相应游戏中的性能已经大大超过第一代产品,不过在顶级的DirectX  10 FSP游戏面前,即使是当前最顶级的显卡与最顶级的CPU也会显得吃力。


Crysis WARHEAD(孤岛危机 弹头)是刚刚发布的一款Crysis的资料片。游戏与Crysis相比,画面精美程度不减,可玩性更高,更加注重整个游戏过程的剧情性。在这款游戏测试中,Core i7在最低分辨率下有1帧的领先,其余分辨率则与QX9770持平。

Call of Juarez是另一款DirectX 10 FPS游戏,不过由于发布时间较早,因此已经基本被主流的高端显卡所征服。在这款游戏中,Core i7的测试结果全面小幅度落后于QX9770,表现再次失常。

● DX10游戏测试 英雄连&冲突世界

严格意义上来说《英雄连》并不是一款DirectX  10游戏,不过在补丁升级到1.71后它加入了对DirectX API的支持,并且画面精美程度大大提升。而本次测试的另外一款游戏《冲突世界》则是原汁原味的基于DirectX 10。


《英雄连》的测试结果同样令人费解,不管是在入门级的1024*768分辨率下还是在24英寸显示器标准的1920*1200分辨率下,Core i7始终落后于QX9770平台,虽然每次落后的幅度都很小,但这种结果按照理论是不应该出现的。

《冲突世界》的测试结果则喜忧参半。低分辨率下Core i7以微弱优势领先,主流分辨率(1680*1050)下二者打平,但是在高分辨率下QX9770所在平台又反超Core i7。

小结:

在本环节测试中,Core i7在3Dmark理论测试中的表现出色,全面领先上一代旗舰产品,但是在实际的游戏测试中却表现得有些不正常。8线程以及巨大的内存带宽优势并没有在游戏中体现出来,从Crysis WARHEAD的测试结果中我们可以看出一些端倪——在Core i7诞生之前的游戏可能没有基于全新的CPU架构进行开发,另一方面则是由于主流游戏对多线程的支持还并不到位。正在进行的IDF台北上,Intel在《失落星球》上展示了Core i7强劲的多线程处理能力,我们接下来也会针对一些全新应用的游戏对Core i7的游戏性能进行重新探讨。

● 节能测试 整体功耗仅上升10%

关于Core i7的Benchmark测试环节就到这里,接下来我们将对其功耗进行测试。从之前的测试可以看到,Core i7相对于上一代产品在各方面有了极为诱人的性能提升,而其130W的TDP也基本与上一代旗舰产品相同。那么它的功耗如何呢?如果仅仅是为了获得性能上的提升而让功耗大大增加,对于用户来说也许并不是好消息。



令Core i7处理器100%负载时的场面非常壮观(点击放大)

我们的功耗测试分为3个方面:

1、Windows待机情况下Core i7+X58平台与QX9770+X48平台的功耗对比

2、开启SP2004令CPU达到100%负载后Core i7+X58平台与QX9770+X48平台的功耗对比

3、运行3Dmark Vantage Extreme测试,对比两套平台瞬间最大峰值。

虽然在3种情况下Core i7+X58的功率消耗都比QX9770+X48高一些,但Windows待机、CPU 100%负载和平台瞬间峰值仅分别提升了3%、7% 3%,这种小幅度的功耗提升所带来的性能提升显然是值得的。Intel官方曾表示Nehalem处理器相对于上一代产品最大提升10%功耗,所言不假。

值得一提的是,Intel非常擅于不断更新步进来降低处理器的能耗,这在45纳米酷睿2处理器上已经有了很好的体现,我们所测试的Core i7 Extreme 965为C0步进,第一批正式出货为C1,而在随后的新步进版本上功耗可能会比本次测试更低。

● 性能总体评价:多方面压倒性优势

○基准运算能力出众

经过全方位的测试,基于Nehalem架构的Core i7处理器基准运算能力的确相对于上一代产品有了突飞猛进的提升。在Everest Ultimate中,Core i7的运算能力有15%-89%的性能提升,而SiSoftware Sandra 2009给出我们的成绩则是浮点、整数运算性能分别提升54%和47.9%。如此巨大的基准运算性能将直接为PC带来多方面应用的全面提升。

○内存带宽优势全面超越



巨大的内存带宽和QPI总线也许并非是瞄准普通家用平台

得益于3通道DDR3内存控制器的导入,Nehalem Core i7处理器一挽以往内存效能不足的窘境,直接将内存读取、写入、复制、延迟的效能提升到一个全新的境界。另一方面,QPI总线的设计让Core i7突破FSB的瓶颈,灵活的总线设计思路可以让基于Nehalem架构的处理器在服务器市场大放异彩,彻底改变以往由内存效能和FSB带来痛楚。

○多线程威力巨大

超线程技术的回归虽然并不能带来双倍的性能提升,但这种设计直接让Core i7在3D图形渲染、视频制作和处理上与上代产品相比取得压倒性胜利,随着越来越陡应用软件加入对多线程处理器的支持,具备8个逻辑运算核心的Core i7将牢牢把握多任务处理领域的话语权。当然,这一切应该建立在传统机械硬盘瓶颈得到有效解决后。

○游戏性能略显不足


仅仅在《失落星球》等个别游戏上的成功并不能掩盖不足

虽然Intel在IDF上用《失落星球》演示了Core i7带来的30%游戏性能的提升,但经过我们对多款主流游戏的测试发现,Core i7为游戏性能提升带来的拉力明显不足。当然这可能是由于前主流游戏还未能对新架构的CPU进行良好支持,或者说游戏对多线程的支持不足,我们只能期待未来的游戏能更多地针对Nehalem这个新架构进行优化,以充分发挥其Turbo技术、多线程技术的优势来。

● 市场预测及展望:顶级玩家必备尤物

○成功接替上代旗舰

四核心Core i7处理器性能全面超越上一代酷睿2四核心产品已经是不争的事实,Core i7与X58的组合已经成功接过上代旗舰的枪。首批上市的四核心Bloomfield产品分为3款,主频从2.66GHz到3.2GHz,售价最低仅284美金,最高999美金,基本与上一代四核心处理器保持平衡,随着Core i7的大量铺货,Core架构的四核心处理器将逐渐淡出市场。


○多媒体工作者不可错过

鉴于Core i7处理器在3D图形渲染及视频转码编码方面的巨大优势,日常以多媒体工作为主的图形设计人员及视频制作人员恐怕应该考虑为自己重新添置一套平台了。Core i7+X58的组合不仅可以令工作事半功倍,而且其多达8个线程的优势还有望让我们在进行日常多媒体制作的同时进行一些其它的操作。

○顶级DIY玩家必备尤物


Core i7在Super π等玩家关注的软件中表现令人惊讶

当然,作为TOP DIYer,Core i7绝对是不可多得的尤物。主频为3.2GHz的Core i7 Extreme 965在仅仅搭配单通道1GB DDR3-1066内存的情况下就能够获得12.906s的好成绩,而在3Dmark Vantage等软件中,基于Nehalem架构的Core i7也同样开始崭露头角,作为喜爱冲击各项Benchmark世界纪录的TOP DIYer,如此尤物岂能错过?

○领先对手两个身位


Nehalem来了,Intel已领先对手两个身位

Intel Core架构的发布让竞争对手在2年时间内无法翻身,只能通过价格战来获取一定的低端市场份额,而Nehalem架构的按时发布直接让竞争对手落后两个身位,诚然,一家独大对终端消费者而言并不是好消息,但从目前的情况看来要击败Nehalem,竞争对手还有很长一段路要走……

加载中...