钢铁侠回归:人类已无法阻止镭风7970了

太平洋科技
【02月17日太平洋电脑网广西站】拜托,钢铁侠是每个男人的春梦,一块显卡,怎么会和男人的春梦扯上关系?本文旨在揭示镭风HD7970与钢铁侠之间的共性:它们都是能耗比的奇迹。英伟之巨,不敌小A核心四两,费米之强,不过Tahiti胯下半斤。能耗比,就是中国太极文化里的“四两拨千斤”,就是Tahiti核心将43亿晶体管装入一元的硬币,能量世界,方寸之间,核心四两,性能万斤。——写在前面
“其实我并不想说,美国可以安逸的躺在椅子里,舒服的喝着冰红茶,完全是因为我的存在;我也不想承认,世界之所以能维持长期的和平,是因为我保持在巅峰状态,我更不想强调,没有人,是的,没~有~人,敢和我单挑!” ——托尼·斯达克(钢铁侠)
所以,笔者其实并不想说,我可以安逸的躺在椅子里,舒服的把频率拉到1200MHz,完全是因为它的存在;我也不想承认,《地铁2033》能够维持长期的40Fps,是因为它始终保持在巅峰状态;我更不想强调,没有卡,是的,没有任何一块单卡,包括GTX580,敢和它单挑。
拽吗?拽!凭什么这么拽?钢铁侠用巴掌大的反应圈,制造出一万个核电站的能量;钢铁侠穿着一件不足0.3t的“衣服”,掀翻了5t的坦克;镭风HD7970用365mm,制造出43亿份1200MHz的高频;镭风HD7970用不足275W的满载功耗,掀翻了《地铁2033》,让GTX580瞬间hold住!下面,我将以一名玩家,而不是显卡评测师的身份,和大家一起分享这份能耗比的传奇!
镭风HD7970是怎样炼成的:
让我们简要回顾A卡的发展史。AMD的DX10初代机,在效能方面就如钢铁侠的原型机一样,体积笨重,能效低下。从最早的HD2000系列开始,“吃力不讨好”的VLIW构架统治了AMD整整6年。打个通俗的比方,VLIW构架里住了四个小朋友,他们分别会计算加、减、乘、除,如果有一道数学题,正好包括了加减乘除这四个步骤,那么,小朋友们只要一个周期就能算出结果;但是,碰到只有加法运算的数学题,并且要进行4次加法运算才能得出结果,那么VLIW就只能命令一个小朋友,计算四次去完成它了,其余三人就hold住吧。
显然,这样的分配方式是非常原始和落后的,于是,AMD在HD6900的身上,将一个智商不怎么高的小朋友“请”了出去,留下3人,并让他们学会新的计算方法——为VLIW瘦身后,全新的VLIW 4D构架应运而生。如同托尼·斯达克在钢铁侠2代机上,舍弃了笨重的合金材料,转而寻求航空级别的氧化锆钛合金,更轻,却更灵活。这就是HD6900系列的Cayman核心。
但分配效率的问题依然存在——三个小朋友每人的运算范围有限,还是需要老师提供指定类型的题目,才能在一个周期内完成。2012年,AMD正式发布了GCN构架,相当于为每一个运算小组,引入了全能型的计算人才,HD7970正是这个构架的旗舰之作。并且,通过28nm的新制程,他们引入的“小朋友”的数量是前代构架的2倍——2048个SP单元,数量之巨,面积之小。正如托尼在钢铁侠三代机上,通过发现新的元素,代替了能耗巨大且有毒素的钯,最终把性能世界,定格在方寸之间!这就是镭风HD7970上的Tahiti核心。
现在,让我们一起欣赏这件神奇的钢铁战甲:
面积大小:HD7970的性能在GTX580之上,芯片面积却比GTX560Ti更小。
超小的核心面积,如钢铁侠的袖珍型小飞弹,无穷能量,方寸之间
更直观的比较:HD7970核心区域只相当于一块1元的硬币,很难想象,这么个小玩意儿内部集成了43亿个晶体管,就如钢铁侠的那颗可爱的袖珍型飞弹,小小一发,却能摧毁M1-爱布朗主战坦克。
长度方面,镭风HD7970卡长29.2cm,能够轻松放入一个中塔式的机箱(不排除一些硬盘位非主流的小机箱)
造型方面,镭风HD7970采用了公版方案,散热罩当然是AMD著名的板砖流,具备真空均热散热腔体,涡轮风扇表面是镭风的Logo。不过这批公版卡都拥有哑光材料的光泽和质感,看上去会养眼许多。
AMD高端公版卡的玩家想必对这个涡轮扇的噪声表现,唏嘘不已。然而,根据笔者的评测,在1.2V+1200MHz的设定下,自动挡的风扇转速不会超过50%,因为满载温度也才72℃出头,因此不必等到第三方散热方案的非公版出世,噪声问题已经变相得到解决。
镭风HD7970有一对mini-DP 1.2接口。这个接口比DP 1.1的数据传输速率提高了1倍。因此DP 1.2可以带来更高的分辨率支持和立体3D支持。镭风HD7970最高支持6个DP接口设备。而mini-DP接口的右边是一个全尺寸的HDMI 1.4a输出——支持3D视频(蓝光3D),和DVI-I接口。这里要强调一点,AMD没有使用2个DVI接口,这么做可以把PCI挡板的上部空出,方便GPU的散热。AMD官方表示移除了一个DVI接口后,不仅温度表现有所提升,空气流动的噪音也进一步减少。
镭风HD7970采用6pin+8pin的供电方式,因此单卡的峰值功耗不会超过280W(6pin能提供最大150W的功率输入,8pin能提供200W的功耗输入)
显卡拆解:
首先,我们对整卡有一个大体的了解:PCB板左侧是一项I/O供电,右侧顶部有一项显存供电,为12颗GDDR5高速显存服务,这12颗显存组成了3GB/384Bit的规格,打破了A卡旗舰一直沿用的256bit的格局。而下方的四颗供电模组则为Tahiti核心供电。
通过与GTX560Ti的对比,我们看到HD7970的PCB背板遍布高品质的贴片电气元件,这也是AMD旗舰公版卡一向的严谨作风,血脉相承。
核心采用斜角45度的方式封装,我们在Barts核心的小面积走向的A卡上也曾看到这样的布局,例如HD6850。硅脂就不擦了,因为GPU抛光面上没有核心信息,信息被蚀刻在承压垫的一条金属边上。
镭风HD7970采用数字PMW+模拟驱动信号的混合供电方式,每相供电配备了铁素体电感、日系固态电容以及DirectFet铜金属封装Mosfet。
镭风HD7970的数字PMW芯片来自CHiL 8828,这也是最常见的数控芯片。
电容采用日本万裕系列的固态电容,这也是AMD公版卡上常见的电容。
采用铜片封装的Mosfet管,能有效降低热阻,提高寿命
显卡背部的IC驱动芯片,型号为8510
供电接口附近配置了扼流电感,让供电口输入的电流纯度更佳、稳定性更好。
来自现代的超高速GDDR5显存,出厂默认频率为1375(等效1375x4=5500,理论频率上限为6000MHz)。
位于PCI-E金手指上部的滤波电感,作用是为PCI-E供电提供更纯净的电流。虽然HD7970已经支持PCI-E3.0规范,而PCI-E 3.0接口的供电能力大幅提升,但仍然无法完全满足这头集成43亿晶体管的巨兽的胃口。
公版散热器的一端为高速涡轮扇,中央部分是均热腔体以及密集的铜质散热鳍片,底部是巨大的纯铜散热座,显存以散热胶的方式进行辅助散热。AMD的高端公版一向不考虑直触式方案,因为这种方案造成GPU表面与铜管缝隙间存入空气,影响散热效率。
密集的镀镍散热鳍片形成了风道系统,鳍片下端是铜质的散热基片,负责与腔体内的热蒸汽进行热交换。
显卡CF桥接口附近是双BIOS的切换开关,方便玩家超频失败或BIOS刷入错误时,手动恢复。而CF桥接口支持四卡并行系统的搭建。
镭风DH7970附件:一条DP转DVI线、双4pin转8pin供电线、双3pin转6pin供电线、一条CF桥接线、一张驱动光盘以及一本显卡使用说明,比较简单。
评测平台:
评测平台
▲使用GTX560Ti进行混交,破解PhysX限制,超频测试通过Afterburner破解CCC控制面板的频率上限
▲与GTX580和HD6970进行性能对比
▲每项测试用功耗仪测量整机负载情况,以“性能得分/功耗值”的比例反应GTX580/HD6970/HD7970三者的能耗比情况
引入最新的游戏大作进行评测
GPU-Z截图
在最新版本的GPU-Z 0.5.8中,Bus Interface(总线接入带宽,即PCI-E X16的带宽)显示的数值为PCI-E 3.0 X 16@ X 16 1.1,表示这是一块支持PCI-E 3.0规范的卡,目前工作在1.1规范下,一开始笔者以为主板的PCI-E PLL信号线或者金属触点出了问题,实际上这是HD7970的动态节能作用使然,在2D模式下,该显卡的功耗值仅为3W,PCI-E接口进入很低的供电状态,远在75W之下。我们知道,PCI-E X16 2.0能提供75W的功耗支持,1.1则在此之下,那么,主板侦测器通过侦测PCI-E接口的供电情况,就会误辨成PCI-E 1.1。
而在3D状态下,Bus Interface就还原为PCI-E X16 V2.0
破解超频极限:
在CCC的驱动控制面板中,频率极值为1125MHz,只需要手动将“电源控制”设置为20%(提供足够的电流供应),风扇设为自动,即可将GPU频率拉满,很轻松。
如果希望突破1125MHz的频率上限,我们需要运用非常手段。首先下载Afterbuner最新版本,然后在文件目录下找到MSAAfterBurner的CFG文件,在UnofficialOverclocking后输入如上图的文字(大意就是非官方的超频不会得到任何技术支持,而且用户已经了解到这点),再把UnofficialOverclockingMod的值设定为"1",就能打开非官方的超频模式。
在该软件上,玩家可以手动调节核心电压
笔者将电压设定为1.2V后,频率可以稳上1200MHz,并能通过3D Mark 11的X模式测试。
小结:得益于28nm的优良的发热控制以及GCN构架强大的超频潜力,镭风HD7970在比较理想的电压状态下,能够达到1200MHz的高频,这在AMD的期间公版卡上属于新的突破。相关的功耗和发热量测试将在后文提及。
与GTX560Ti混交,破解物理加速限制:
英伟达的PhysX物理加速一直是一个封闭的驱动,即便HD7970在神,在一些物理加速游戏面前,也是巧妇难为无米之炊。然而,这最后一道能阻止HD7970的防线,也被有爱的驱动破解者击毁了——下载PhysX mod 1.05ff,在安装完成Nv的285.62 Whql驱动驱动后,不要重启,直接点击“apply”,就能让GTX560Ti辅佐HD7970进行物理加速。
使用PhysX mod 1.05ff,GPU-Z的“PhysX”前的小框已经打上勾,证明破解成功,但Nv的驱动控制面板仍无法使用。
物理破解对比性能测试:
使用《地铁2033》的benchmark工具,在里面开启PhysX选项
《地铁2033》 with PhysX on,使用CPU进行软解,帧数为33Fps。
《地铁2033》 with PhysX on,使用GTX560Ti进行物理加速,帧数上升为39FPs。考虑到《地铁2033》本身的物理元素不是很丰富,测试场景中只有爆炸场面产生物理加速,因此成绩提升不明显。
使用《黑手党2》游戏内置的benchmark工具,开启PhysX选项
《黑手党2》with PhysX on,CPU软解帧数为15.6fps,HD7970沦为HD5550。
《黑手党2》with PhysX on,GTX560Ti辅佐物理加速,帧数飙升为53.8fps,提升了接近4倍!已经没有人能阻止镭风HD7970了!
《蝙蝠侠2》的physX设置由“off”调整为“High”,但游戏仍然提示“您的硬件无法支持PhysX”,看来道高一尺魔高一丈,Nv早就在这款出了名的PhysX优化游戏中,完全禁用了软性的破解,赤裸裸的垄断啊!
破解物理加速之前的成绩:35Fps
破解物理加速后的成绩:36Fps,属于正常误差,别无二致
小结:目前PhysX的游戏的应用范围虽广,但能够完全体现PhysX特性的游戏,目前只有《黑手党2》以及《蝙蝠侠》系列。虽然HD7970破解硬件PhysX支援成功,但只能在《黑手党2》上尝到甜头,《地铁2033》因为物理特性不明显,破解前后的性能增幅不大,而《蝙蝠侠2》又完全屏蔽了这类软破解,因此,希望搭建混交平台,体验HD7970的性能和Nv的硬件物理加速的朋友,还需做出更多的考虑。
2160P高清硬解测试:
2160P是继1080P后兴起的超高清视频分辨率,具有惊人的码率,即便是四核八线程的i7-930,OC 4.2GHz后,仍然无法实现流畅的播放。其中最著名的2160P视频当属“万人马拉松”,仅仅10s的视频却能轻易让CPU占用率飙升至100%,并且就像看幻灯片。笔者通过使用《暴风影音》中的cyberlin解码器(专门针对AMD内建的UVD解码器优化),来实现真正的2160P流畅体验。
镭风HD7970提供的2160P硬解视频截图帧数达到了30Fps的
理论游戏性能测试:
3D Mark 11
鉴于笔者使用的平台已无法充分发挥HD7970的性能,因此使用V1.0.3版本的Advanced Edition,来观察GPU的单项得分。
3D Mark11软件笔者在此不做过多的说明,卡友们应该不会陌生。在默频状态下,3D Mark 11 X模式的分数为X2498,GPU单项分数为2268。
GPU OC 1125MHz时的成绩,GPU单项分数为2603
GPU OC 1200MHz时的成绩,GPU单项分数为2771
三卡成绩对比
以功耗/性能的比值做函数图:
小结:我们可以看到,随着GPU频率的上升,Tahiti核心的性能提升非常明显,但突破1125MHz后,Mark11 X模式的GPU单项成绩提升速率开始放缓,这可能与SP单元的频率提升后,指令分配单元无法跟上步伐,提供高效的资源调度命令有关。
3D Mark Vantage
H模式下的GPU单项分数为22997,总分为H23385,这个成绩意味着您能够以2560x2160P的分辨率,以6屏的状态畅玩《crysis》第一代(A卡的抗锯齿最高只能支持到8XAA,因此显存不是问题)。
GPU OC 1125MHz的成绩
鉴于3D Mark Vantage的Extrem模式需要1920x1200的分辨率支持,而目前许多显示器只能提供16:9的1080P的分辨率,因此笔者只能通过调整单项的图形设置,最大极限的反应“Extreme”模式的分数。在这个模式下,GPU单项分数为19796。
三卡成绩对比
以功耗/性能的比值做函数图:
《天堂v2.5》
·细分曲面级别为extreme
·抗锯齿调整为8x
默频成绩
OC成绩
三卡成绩对比
以功耗/性能的比值做函数图:
DX11游戏性能测试:
《战地3》
为了全面反映镭风HD7970在这款Fps联机巨作中的 真实效能,笔者特意升级了EA官方的Origin update 4号补丁,该补丁声称加入了对HD7970的优化支持。
进入多人模式,在控制面板中将所有画面设定调到最高,抗锯齿很可惜只能开到4x MSAA(游戏限定)
在《地铁》场景的室外(战地3中公认的帧数最低的地带),镭风HD7970亦能有43Fps的表现。
三卡成绩对比
使用镭风HD7970,您还能体验到:
怒海狂涛、压城黑云,这效果,不解释!
空中格斗关卡,登上航母甲板,笔者立即被眼前的场景震撼了:怒海惊涛之上,黑云翻滚,远处闪动阳光投下的金柱,暴雨倾泻在甲板上,溅起阵阵雨雾,配合完美的音效引擎,雨点打在头盔上、打在甲板上的声音,各不相同,伴随着质感十足、低沉轰鸣的战机引擎,笔者的心脏开始充血。
进入驾驶座,机舱盖的透明质感和战机上广阔的视角,塑造得非常逼真——包括《鹰击长空》在内的飞行游戏,都未能营造出如此令人销魂的战机座舱视角!
起飞后,笔者脚下就是广袤的太平洋,头顶着厚重的乌云,那种飞翔的快感,瞬间麻痹了全身,太赞了!!!
惊艳的沙漠环境。烈日炙烤下,万千铁骑奔袭,你甚至可以听到,那些重达10吨的愤怒的铁兽,用履带碾碎沙土的声音!男人的游戏啊!
无与伦比的破坏效果
天崩地裂的瞬间
crysis 2
·通过游戏自带的Benchmark工具进行测试
·效果调整为Ultra
·抗锯齿模式为Laplace Edge Detect(形态边缘识别,A卡的强项)
·场景选择Downtown,重复3次测试取平均值
镭风HD7970在默频状态下的成绩为56.1Fps
镭风HD7970 OC 1125MHz后,成绩飙升为62.4Fps
三卡成绩对比
失落星球2:
·全DX11模式
·抗锯齿8xAA
默频成绩
OC成绩
三卡成绩对比
蝙蝠侠2
·关闭physX
·抗锯齿为8xAA
默频成绩
三卡成绩对比
《尘埃3》
·全Ultra效果
·抗锯齿设定为8xAA
默频成绩
OC成绩
三卡成绩对比
《异性VS外星人》
·第三方Benchmark软件
·DX11全高效果
三卡成绩对比
DX10游戏性能测试:
《质量效应3》测试
·因为是试玩的demo版本,内建的画质调节选项不是很细(虽然可以通过config文件自行修改)
·分辨率设定1920x1080
·抗锯齿:打开
·动态阴影:打开
在这里重点介绍《质量效应3》,这是本站引入的最新的评测巨作,它是《质量效应》三部曲中的最终章,故事背景更为宏大,战斗场面更为壮阔,指挥官sherpad肩负拯救整个银河系的重任(当然首要任务还是拯救地球老家),游戏将引入全新的即时光照系统。
游戏模式分为三个等级:Action(动作)/Role playing(RPG体验)/story(故事剧情),其实就是难度设定:困难/一般/打酱油的游客。
游戏场景,叹为观止!
三卡成绩对比
《孤岛危机1》测试:
·全DX10 ultra效果
·打上画质增强补丁
·8xAA抗锯齿
·使用第三方bechmark软件
默频成绩
《孤岛惊魂2》测试
·Ultra效果
·8xAA抗锯齿
·使用第三方bechmark软件
默频成绩
OC成绩
温度测试:
自动风扇设定状态下,待机温度为32
风扇转速调整至80%后,满载温度为63℃
GCN构架的SP利用效率提升很大,因此每个时钟周期在运作的SP单元就会提升,发热量理论上会略微升高,然而,得益于28n制程的工艺,镭风HD7970的温度控制非常理想。
功耗测试:
以领先GTX580平均10%以上的性能,能够获得比HD6970更低的功耗表现,加上待机时单卡功耗为3W,其能耗比表现为当今显卡之最!
噪声测试:
因为28nm的发热量本身得到了有效的控制,因此即便是自动档的风扇设定,涡轮转速也不会随着温度的提升而拉得太高,其声噪表现相较于上一代的HD6970有了很明显的进步。
评测总结:
这些总结,是一首歌,鄙人命名为《因为镭风HD7970》:因为28nm,就不会有热量,所以一切都是冰冷的摸样;因为28nm,就不会有屏障,所以频率都是1100MHz以上;因为,GCN,就不会有Fps的悲伤,所以一切都那么流畅;因为能混交,就不会有彷徨,A卡也是PhysX的天堂——人类已经无法阻止镭风HD7970了!除了价格...