全民融聚AMD A8-3850处理器全球首测
作者:小熊在线-宁道奇
开启崭新的融聚时代:AMD A8-3850处理器评测
在2006年10月25日,AMD完成对ATi的并购后,公司就公布了“Fusion”战略,并预计在2009年底或2010年初发布实际产品,成为经典速龙II/羿龙II的后继者。当时这个跨时代的构想被命名为“Torrenza统一加速计算平台”,核心处理器CPU将能配合FireStream显示流处理器进行协同运算。时间一晃5年多过去了,AMD的伟大构想和承诺成为了现实,就在今天,AMD终于宣布推出面向主流桌面消费类计算的新一代高性能A系列APU(Accelerated Processing Units加速处理器)。AMD A系列APU是一颗融合了串行计算X86处理能力以及并行图形处理能力并能将两者融为一体彼此加速的超级芯片,他具有出色的游戏/高清图像显示功能、极快的运算速度和创新的异构计算特性,可为主流台式机以及笔记本用户带来真正全能全速的次世代计算体验。
在这篇文章中,你将会看到AMD最新的A8-3850处理器和搭配最新的A75芯片组的详细技术解析和测试成绩。你将看到下一代异构计算初露的曙光,了解到未来的计算将会是怎样的。同时你也将了解到AMD全新的主流台式机级的APU能给我们带来怎样激动人心的应用体验。
什么是AMD Fusion:融聚本质
相对于串行计算,并行计算可以划分成时间并行和空间并行。时间并行即流水线技术,空间并行使用多个处理器执行并发计算,当前研究的主要是空间的并行问题。以程序和算法设计人员的角度看,并行计算又可分为数据并行和任务并行。数据并行把大的任务化解成若干个相同的子任务,处理起来比任务并行简单。本着这个自然哲学思想,我们一直在不断探索,寻求更高效的计算法门。
AMD Fusion是AMD在并购ATi后推出的一项新产品的产品代号,它结合了常见的X86处理器和独立显示核心。在一颗AMD Fusion的芯片上拥有两个独立的计算核心,一个负责处理器,另一个负责图形核心,两个核心并不是完全的混淆在一起。X86处理器核心有自己独立的缓冲内存,独立显示核心部分同样有完整的执行单元。两个核心会互相配合协同工作,由此这样的处理器不再是传统意义上的中央处理器单元,它可以在一颗小小芯片上实现以往要数个电脑元器件才能完成的工作甚至更高效,它有一个更好听的名字—APU(Accelerated Processing Units加速处理器)
从此X86处理器和绘图核心真正的合二为一不再各自为政,令人兴奋的是,APU内部的独立显示核心还可以与一块额外的传统独立显卡组建特殊的CrossFireX双显卡混合交火,让这块独立显卡性能倍增。同时,A系列的APU还集成了新一代的DDR3 1866内存控制器,处理器和绘图核心可以直接访问内存AMD Fusion技术可以让普通家用电脑更省电节能。例如一台电脑配置了Fusion处理器和独立显卡。当普通上网听音乐时,可以关闭独立显示卡,只使用A系列APU内置的显示核心,以降低能耗。当需要玩3D游戏的时候,则可以打开独立显卡组成混合交火模式,提供更强大的显示性能。
计算的发展历程:从32bit到异构计算(上)
2003年以前,是32bit的时代。处理器制造厂商,不断提升制造工艺技术,使用更精细的制程来制造处理器。同时也不断提高处理器的频率,如133MHz、166MHz、200MHz、300MHz……最终频率提升到了3GHz后,就难作寸进了。到目前为止我们也未曾见到Intel和AMD发布高于4GHz主频的处理器产品。
2003年出现了x86-64,有时会简称为“x64”,是64位微处理器架构及其相应指令集的一种,也是x86架构的延伸产品。“x86-64”1999由AMD设计,AMD首次公开64位集以扩充给IA-32,称为x86-64(后来改名为AMD64)。其后也为英特尔所采用,现时英特尔称之为“Intel 64”,在之前曾使用过Clackamas Technology (CT)、IA-32e及EM64T。外界多使用"x86-64"或"x64"去称呼此64位架构,从而保持中立,不偏袒任何厂商。
AMD64像把16位的Intel 8086扩充成32位的80386般,去把x86架构扩充成64位版本,且兼容原有标准。AMD64架构在IA-32上新增了64位暂存器,并兼容早期的16位和32位软件,可使现有以x86为对象的编译器容易转为AMD64版本。除此之外,NX bit也是引人注目的特色之一。不少人认为,像DEC Alpha般的64位RISC芯片,最终会取代现有过时及多变的x86架构。但事实上,为x86系统而设的应用软件实在太庞大,成为Alpha不能取代x86的主要原因,AMD64能有效地把x86架构移至64位的环境,并且能兼容原有的x86应用程序。
计算的发展历程:从32bit到异构计算(下)
2006年出现了双核心多核心。多核心,也叫多微处理器核心是将两个或更多的独立处理器封装在一起的方案,通常在一个集成电路(IC)中。双核心设备只有两个独立的微处理器。一般说来,多核心微处理器允许一个计算设备在不需要将多核心包括在独立物理封装时执行某些形式的线程级并发处理(Thread-Level Parallelism,TLP)这种形式的TLP通常被认为是芯片级多处理。在游戏中你必须要使用驱动程序来利用第二颗核心。
此后处理器制造厂商发现,利用多核心架构可以在不提升处理器频率的情况下,继续不断提升处理器的效能。
2008年通用计算GPGPU
通用图形处理器(General-purpose computing on graphics processing units,简称GPGPU),是一种利用处理图形任务的图形处理器来计算原本由中央处理器处理的通用计算任务。这些通用计算常常与图形处理没有任何关系。由于现代图形处理器强大的并行处理能力和可编程流水线,令流处理器可以处理非图形数据。特别在面对单指令流多数据流(SIMD),且数据处理的运算量远大于数据调度和传输的需要时,通用图形处理器在性能上大大超越了传统的中央处理器应用程序。
3D显示卡的性能从进入新千年后就颇受瞩目,时间到了2008年,显示卡的计算能力开始被用在实际的计算当中。并且其处理的速度也远远超越了传统的x86处理器。
2010年CPU+GPU异构计算
对于GPGPU表现出的惊人计算能力叫人为之折服,但是在显卡进行计算的同时,处理器处于闲置状态。由此处理器厂商也想参与到计算中来,他们希望CPU和GPU能够协同运算,完成那些对计算量有着苛刻要求的应用。同时也希望将计算机的处理能力再推上一个新的高峰。
异构计算要求CPU和GPU协同运算
迥异:不同计算架构的特点
对于个人计算机而言,尤其是x86架构的计算机,异构计算的步伐则要慢许多。这是因为,无论是处理器还是显示卡,又或者其他运算部件,都有其自身的架构和特性。他们是针对不同领域,面向不同应用所设计的芯片。所以他们在功能性方面千差万别。要想将他们都统一起来,除了需要制定共同的规范和标准之外,还要针对其计算的特点设计软件。
举例来说,CPU和GPU在进行计算时,就有许多不同。对于处理器来说,它是一颗通用处理器。它要应对各种类型的计算应用。无论是数学方面的,还是逻辑方面的运算。我们可以看到,一颗比较常规的处理器其中的ALU计算单元仅仅占据整个核心面积的25%以内。在处理器中,超过50%的核心面积用来制作Cache高速缓存,无论是L1、L2还是片上的L3。而另外还有25%的核心面积用来作为控制器。它控制着处理管线的运作,控制着各种分支预测,让多核心处理器可以更有效率。
而我们再反观GPU,其结构要简单的多。GPU的任务是加速3D像素的计算。因此我们在显卡中可以看到数以百计的流处理器单元或者是CUDA核心。而在整个计算过程中,GPU承担的逻辑计算任务非常小。同时它有着更宽的显存带宽,有着更高速的显存。所以在GPU芯片中,也就无需更大容量的片上缓存机制。
通过上文的分析,我们可以看到CPU适合作所有工作。各个方面都比较平均。逻辑处理能力要比GPU快,但是对于数学计算方面,其速度不如具有海量处理核心的GPU快。而GPU方面,数学计算性能强大,大规模并行处理机制强大,但是逻辑处理能力不足,仅仅能在某些计算领域应用。
Fusion融合:“Lynx”平台解析
此次AMD最新发布的A系列APU,会让你的个人电脑具备出色的图形性能和优秀的计算效能。突破以往任何一种传统的计算模式,迎来崭新的异构计算的新时代。为了满足这些日益增长的需求,2011年6 月30 号,代号为”Lynx”的AMD 新一代平台及A 系列APU 正式发布,以卓越的图形性能、多任务处理能力、高性价比以及高能效等多方面优势,满足广大主流用户的应用需求,带来个人桌面计算次世代的全新体验。
基于AMD A 系列APU 的“Lynx”平台开创出了一种新型的平台模式,称之为“融合平台”,其同时具备传统独立以及整合平台的优势,提供独立显卡平台的显示性能、创新的异构计算特性,并能实现混合交火。同时具备低功耗,价格优势等特点。作为”Lynx”平台的核心,AMD A 系列APU,以32nm 制作工艺,在一颗芯片上融合了最多达4 个x86 CPU核心和性能强大的支持DirectX 11、OpenCL 的独显核心:具有最多达400 个Radeon内核和专用的高清视频处理能力。能为台式机带来高达500 gigaflops 的浮点运算性能,确保满足用户在诸如游戏、视频和图像处理、人脸识别、手势识别和多任务等情形下最苛刻的应用需求。
AMD Fusion APU系列的发布,可以说是微型处理器发展史上30多年中,最大的一次变革。真正第一次将GPU高度整合进CPU中,让两者无间的在一起紧密工作。这种设计达成了晶体管的最大使用效率,用最小的晶体管数量,最小的芯片面积,实现了处理器巨大的性能提升。与此同时,高度的集成化设计也让芯片的功耗降低到了一个难以想象的程度。
APU不仅仅是一两款处理器产品,它是一个庞大的处理器产品家族。在未来,随着APU的概念在市场中全面开花,无论是台式机还是笔记本领域,独立的处理器,独立的显示卡所占的份额会越来越少。整合GPU与CPU之功能的APU将会有迅猛的增长。这是未来几年内,处理器市场最重要的技术发展趋势。
Fusion A系列APU架构解析:32nm制程,L2 1MB
AMD A系列 APU架构
32nm制程,L2 1MB
Llano APU采用了GlobalFoundries最新的32nm工艺制造而成,同样的晶体管规模,32nm工艺制造出来的核心面积是45nm产品的70%。同时CPU和GPU共享了内存的控制器,由此又能节约一部分晶体管。
对于一颗中央处理器来说,最重要的就是L2缓存,处理核心可以直接和L2缓存“对话”,效率极高,同时L2缓存还肩负和GPU单元异构计算的重要任务,因此AMD工程师为A系列APU配备了1MB的大容量L2高速缓存,这个数字是经典Stars架构处理器L2缓存的两倍。
在L2的容量X2之后,AMD的工程师还进一步对Llano APU的IPC每个时钟周期执行的指令数量作了进一步优化,相比上一代Phenom II的Stars架构,Llano APU要提升6%之多。结合32nm制程工艺,即减小了芯片尺寸,又提高了运算核心的效能。
Fusion A系列APU架构解析:4个核心,强大的独显核心
AMD最新的A系列APU集成了四个x86处理核心,他们都可以支持AMD的Turbo CORE功能,根据应用环境的不同,自动提升核心频率。同时还继承了支持DIY用户手动超频的传统OC模式,这和Intel主流处理器完全锁死了手动超频的设计有很大的区别。
本次评测的这颗“Lynx”平台及A系列APU作为一款革命性的产品,在很多方面都是前所未有的,不仅仅在其性能变化上,甚至包括了对整个PC 产业的影响,因此有些传统名词也许就不适合用于全新的A系列APU了。因此这里我们所看到A系列APU里融合的这颗Radeon显示核心,是一颗独显级别的显示内核。拥有多达400个流处理器,它的性能已经远远超越并羞辱了在2011年6月30日之前存在的任何集成显卡/核显产品(详见下文评测数据)。
在AMD A8-3850中所集成Radeon HD6650D独显核心不光只有性能惊人,除了完全支持DirectX11特性,在主流的DX11游戏中可以尽情的发挥出所有特效外。HD6650D APU独显核心还支持顶级的UVD3硬解码引擎,可以提供Blu-ray 3D回放硬解码。另外也支持HDMI 1.4a规范,可以直接通过主板上集成的HDMI接口接驳3D电视。当然,这还没完,A系列APU最能吸引DIY用户的就是可以直接和另一块独立HD Radeon 显卡组成特殊的APU+独显的混合交火系统,3D性能还能再提高75%!
当然,有些发烧友仍不满足,顶级才是王道,那么没关系,Llaon APU同样支持传统高端双独显交火。它总共集成了24条PCI-E 2.0通道,其中16条是给独立显卡用的,最多可以拆分成两个PCI-E X8支持双独立显卡。Unified Media Interface(UMI总线)占用其中4条PCIe 2.0通道,组成了系统中的一道高速连接总线。另外,还有4条通道,用来连接其余的特定功能的芯片。APU提供了VGA、DP、HDMI、DVI全兼容的输出接口。在双头DVI连接的部分,提供2560x1600的高分辨率输出特性。
Fusion A系列APU架构解析:A系列四款桌面级APU
2011年6月30日AMD首发的A系列APU分为两个系列。无论是融合的独显核心,还是处理器核心频率以及TDP都有所差别。根据性能分别命名为A8和A6。最强的A8-3850千颗售价135美金,是目前A系列APU中规格最高的。融合了四颗改良Stars X86处理核心和一个HD6550D独显核心,TDP功耗100W,,主频2.9GHz,共有4MB容量的L2高速缓存并最高支持双通道的DDR3-1866内存条。相比Intel最新的SNB平台仅仅支持DDR3-1333双通道内存来说提高了很大一个档次。AMD是在Hammer核心时代,最早提出将内存控制器集成到x86处理器核心内部,而在A系列的APU,我们再一次看到了AMD在内存性能和规格方面的领先优势。
Llano核心解析:一个真正的异构计算芯片
新一代Llano处理器,是一颗真正意义上的异构计算处理器。从这张这新架构图中,我们可以看到Llano具备四个处理核心,每一颗核心具有相同类型的L1高速缓存。同时每一个处理核心具备容量为1MB的L2高速缓存。由此在处理器的部分,构成了4MB的二级缓存。
在整个芯片接近50%的面积上,是GPU的部分。一颗处理芯片同时包含了CPU和GPU的部分,这可以说是非常典型的异构计算架构。同时,在芯片的两边我们也可以看到高度集成的4个PCIe总线控制器,还有一个128bit位宽的DDR3内存控制器。
这样的异构计算芯片可以充分发挥不同计算部件的优势。当需要进行较多逻辑计算时,可以使用CPU部分完成。当需要大量的浮点运算时,可以借用GPU的浮点运算处理管线来完成。同时如果处理器的某些核心正处于空闲,也可以让其加入到计算中来。由此可见异构计算不仅仅是需要统一起不同类型的计算部件,同时也需要有针对性的让更适合的硬件作适用的计算工作。
Llano核心解析:强大的独显核心
在A系列APU中集成的HD6550D独显核心,是一颗非常先进的芯片。它拥有80个Radeon Cores处理核心,基于VLIW5流处理器架构,因此集成有80x5=400个流处理器。整颗APU采用的是GloblFoundries的32nm制程技术,因此这颗HD6550D独显核心也采用的32nm制程。HD6550D独显核心拥有第二代统一渲染架构,完整的DX11 API支持,支持Tessellation曲面细分,支持ShaderModel 5.0,支持OpenGL 4.1。在反锯齿方面支持高品质抗锯齿和各项异性过滤,最高支持24xMSAA、SSAA、MLAA反锯齿。同时它还支持当下最热门的OpenCL 1.1规范和微软的DirectCompute 11 API。支持AMD的APP异构计算加速技术。
AMD A系列APU中所融合的独显核心并不都是一样的。A8和A6两个系列的APU,其独显核心稍有差别。A8集成的是HD6550D,支持400个流处理器拥有5条SIMD,其GPU核心的工作频率为600MHz。另一边的A6 APU所集成的是HD6530D独显核心,支持320个流处理器,4条SIMD,材质单元也被减少到16个。其工作频率仅有443MHz。由此A8的GPU可以提供480GFLOPS的计算量,A6的GPU部分可以提供284GFLOPS的计算量。
最新的A系列APU中所融合的独显核心,并不仅仅作为一颗简单的GPU来使用。上文已经说过了,它已经完全超越了传统意义上的“集显”范畴。你可以用这颗HD6550D与外部的独立显卡,组成双显卡混合交火。由此玩家可以得到:纯正的DX11特效支持,近乎双倍的3D游戏性能提升,甚至是Eyefinity三屏显示输出。
Llano核心解析:A75/A55芯片组解析
配合A系列处理器,AMD发布了两款芯片组A75和A55。他们均支持AMD的Lynx平台,采用的是全新的FM1接口。两者最大的不同就是南桥芯片对于各种I/O接口的支持方面。A75支持6个SATA 6Gbps接口,而A55则支持6个SATA 3Gbps接口。同时A75原生支持4个USB 3.0接口和10个USB 2.0接口。而A55则支持14个USB 2.0接口。
另外A75还支持FIS-based Switching技术。FIS-based Switching模式允许多个SATA设备在同一时刻共享SATA数据带宽,所以执行效率较以往的Command-based Switching模式更高。但是FIS-based Switching模式在实际使用中需要进行频繁的数据传输处理,如果通过硬件实现必然导致南桥芯片制造成本提高,软件支持又会占用CPU资源。早在SB850时代,AMD就已经率先基于硬件支持这项技术。
将FIS-based Switching集成在南桥芯片中,可以让整机的磁盘处理效能大幅提升,尤其是在多磁盘,多任务模式下,提升的幅度会更加显著。这对于长期以来磁盘方面的性能瓶颈改善功不可没。
在2011年,AMD桌面平台的产品中全面启用了新的品牌Logo,今后的AMD产品中,将会由VISION品牌一统天下。配合上面的A8、A6等小标记来区分高低产品线阶层。而各种支持的先进技术,也将会以橙底白字的图标方式,清晰的呈现在消费者的面前。
阶段总结:AMD最新的A系列APU处理器,将会集成独显级别的显示核心。处理器与显示核心完全融聚在一颗die上。其融聚的独显核心具备高达573GFLOPS的计算量。整合的4颗x86处理核心为改良Stars架构比现有AM3处理器更为先进。首先支持双通道DDR3-1866内存控制器,提供了极致的内存带宽。卓越的32nm半导体制造工艺技术带来了前所未有的功耗控制表现和无限超频可能性。
Lynx平台初体验:AMD A8-3850处理器真身
AMD A8-3850处理器真身
A系列APU所采用的Socket FM1接口
数一数,共计905pin,31H x 31W - [5H x 7W (中心孔)] - 13 (边角) -[4 x 2 (中间)] = 905
Lynx平台初体验:三代AMD处理器大对比
Socket FM1看起来要比AM3+小一点但实际内有乾坤
AMD A8-3850(左)Phenom II 965(中)Athlon II 645(右)
A8-3850采用uPGA封装,面积40x40mm,高1.27mm,上图是拆掉顶盖的样子
Lynx平台初体验:当A8遇上Socket FM1接口赏析
A8-3850处理器插在Socket FM1接口上
Lynx平台:华擎A75 Pro4主板概览
华擎A75 Pro4主板
背部接口
Socket FM1接口
Lynx平台:华擎A75 Pro4主板解析
处理器五相供电设计
支持双显卡混合交火
南桥芯片上的散热器
Lynx平台:华擎A75 Pro4主板 背部接口
我们可以看到四个蓝色的USB 3.0接口
主板提供了4个SATA 6Gbps接口
主板上可以看到支持CrossFireX标识
Lynx平台:华擎A75 Pro4主板 支持特性
APU原生支持DX11,支持USB 3.0在主板上都有看到标识
内存条正式支持DDR3-1866规格
主板集成的HDMI支持1.4a版本,支持3D电视
Lynx平台:华擎A75 Pro4主板BIOS一窥
构建起测试平台后,小编首先进入的就是主板的UEFI BIOS。本次评测试用的是A8-3850处理器,运行频率为2.9GHz,L1高速缓存容量为512KB,L2高速缓存容量为4MB。不过默认情况下,DDR3内存仅仅开启了1333模式。需要手动调节到DDR3-1866。
APU支持DDR3-1866内存
USB 3.0控制器设置
A8-3850最大频率为3.6GHz,最大电压为1.4125V
这里可以设置启动时的显示核心
测试平台
为了充分体现AMD全新的A系列处理器的特点。我们设计了2组对比测试平台。第一组针对整合平台用户的应用性能测试。选择了AMD A8-3850和目前市面上的最强性能集显Intel Core i5 2500K平台作对比测试。通过主流的游戏软体和测试工具,分析两组平台综合效能。
第二组测试平台则是针对主流用户的应用性能测试。选择了AMD A8-3850搭配A75芯片组主板,配合Radeon HD6670显卡,组建双显卡混合交火平台,同时还搭配了DDR3-1866内存。在Intel方面我们选择了Intel Core i5 2300处理器,搭配H67主板,配合Radeon HD6670显卡,组建独显平台。
在测试项目方面,我们更偏重于整机的性能,和消费者的游戏应用体验感受。因此设计以下测试:
·3DMark11
·3DMark Vantage
·CINEBENCH11
·Super Pi
·wprime 200
·7-zip
·Fritz Chess
·HC Benchmark异构运算测试
需要特别指出的是,针对CPU+GPU的异构运算测试,我们特意找来了中国计量院所自主研发的一套基于Windows7环境下的异构计算测试软体。
在游戏方面我们使用了以下游戏:
·最终幻想14
·生化危机5
·街霸4
·失落星球2
·Crysis:Warhead
·Metro 2033
·Call of Duty:Black Ops
·星际2
·鹰击长空H.A.W.X
·FarCry2
·DiRT2
硬件测试平台1 | ||
处理器 | AMD A8-3850 | Intel Core i5 2500K |
内存 | team DDR3-2000MHz(7-7-7-20) | |
主板 | 华擎 A75 Pro4 | 精英H61H2-A |
显卡 | 内置Radeon HD 6550D | 内置HD3000 |
显示器 | Acer 23吋(分辨率 1920x1080) | |
硬盘 | 西部数据1TB黑盘 | |
电源 | TT ToughPower 850W | |
系统平台及驱动信息 | ||
操作系统 | ||
显示驱动 | AMD_8.862_RC1_Win7_Vista | 14.42.11.5355 |
桌面 | 1920x1080 | |
DirectX版本 | DirectX11 |
第一套对比测试平台
硬件测试平台2 | ||
处理器 | AMD A8-3850 | Intel Core i5 2300 |
内存 | team DDR3-2000MHz(7-7-7-20) | |
主板 | 华擎 A75 Pro4 | 精英H61H2-A |
显卡 | Radeon 6550D+6670 双显卡 | Radeon HD6670 |
显示器 | Acer 23吋(分辨率 1920x1080) | |
硬盘 | 西部数据1TB黑盘 | |
电源 | TT ToughPower 850W | |
系统平台及驱动信息 | ||
操作系统 | ||
显示驱动 | AMD_8.862_RC1_Win7_Vista | 14.42.11.5355 |
桌面 | 1920x1080 | |
DirectX版本 | DirectX11 |
第二套对比测试平台
测试平台1:3Dmark11和Vantage
这里需要指出的是Intel的HD3000系列显示核心,并不完全支持DX11特效。因此在最新一款3DMark11的测试中,Core i5 2300并不能跑出成绩。而A8-3850凭借着完全支持DX11的6550D独显核心则顺利完成了测试。
第一个正面交锋在3DMark Vantage,由于3DMark Vantage是一款完全针对DirectX 10开发的测试软件,只提供DX10的API,Core i5 2300终于可以完成测试,但A8-3850内置的6550D独显核心的测试成绩第一次映入我们的视野。性能确实异常强大,其成绩居然达到了Core i5 2300内置核显的3倍。
测试平台1:街霸4、失落星球2、Crysis:warhead
测试平台1:Metro 2033和Call of Duty:Black Ops
测试平台1:星际2、H.A.W.X、FarCry2
测试平台1:DiRT2、最终幻想14、生化危机5
测试小结:在第一节的测试中,我们可以清楚的看到,以A8-3850 APU为核心的Lynx平台,非常轻松地便秒杀了号称目前最强整合平台的SNB Core i5 2500K(HD3000)平台,为入门级玩家带来了媲美独立显卡般的视觉体验,实现了更好的应用性能,而且价格却仅仅是后者的三分之二。
测试平台2:3Dmark11和Vantage
A8-3850+A75以及Core i5 2300+H61两套平台都接驳上一颗HD6670显卡。但事实上,AMD的A8-3850其融合的显示核心可以与HD6670显卡组建双显卡混合交火系统。将处理器内部的显示核心与独立显卡并联工作。根据不同应用和不同的游戏,其性能大致有1.2x至1.8x的提升。而Core i5 2300内部整合的HD2000显示核心则直接被屏蔽而转为常规的CPU+独立显卡的运算模式。
测试平台2:CINEBENCH 11
在CINEBENCH 11的测试中,我们看到OpenCL通用计算方面,AMD要远远优于Intel。不过在单核心与多核心处理效能方面。优于CINEBENCH 11并未对异构计算架构作特殊的优化设计。因此A8-3850并未讨到什么便宜。
测试平台2:SuperPi、wprime200、7-zip、Fritz Chess
Intel目前在Super Pi测试项目中,一直有很大的优势。但是Super Pi也并未对异构运算作任何的优化。
wprime 200的测试中,针对多核心处理器作了许多优化。虽然A8-3850和Core i5 2300同样具备4个处理核心,但而Core i5 2300的整体效率难敌A8-3850。
在7-Zip和Fritz Chess的测试中,同样存在类似情况,初步推断有可能是GPU异构计算提升了AMD APU平台的性能。
测试平台2:HC异构计算
事实上,异构计算软件并不是我们想象的那么晦涩难懂特别高深的软件。它主要分为办公、视频、上网、游戏四个方面考察测试平台的综合性能。
在实际的测试中,它会自动调用文档、自动对480P视频进行转码,还会模拟3D模型的顶点爆炸
在测试的过程中,你可以实时的看到CPU和GPU相互协同工作,完成的任务量,非常直观的看到谁做的任务多,谁做的任务少。其中黄色格子代表GPU所完成的运算量,而蓝色格子则代表CPU完成的运算量。
最终系统会为测试的系统给出一个综合的成绩和各项测试的成绩
AMD A8-3850测试平台的异构计算模式可以让GPU和CPU彼此加速,协同计算。而Intel的Core i5 2300测试平台处理器和独显由于“各自为战”,并不能调用其内部集成的显示核心。因此性能不及AMD的异构计算架构强大。
测试平台2:最终幻想14、生化危机5、FarCry2
AMD A8-3850平台应用了APU内置的6550D+外置独立HD 6670双显卡混合交火,因此在游戏方面更近一步有上乘表现。其综合的性能相对于单卡模式来说有1.2x至1.8x的性能提升。而Intel平台内置显卡核心在外接显卡模式下必须被屏蔽,仅仅凭借一块独立的HD6670在大多数游戏中表现自然不如AMD平台。
测试平台2:街霸4、鹰击长空、Crysis:Warhead
测试平台2:Metro 2033和星际2
测试平台2:DiRT2、失落星球2
APU大应用 视频增强:ArcSoft TMT
除了各种常规的应用,AMD “Lynx” APU平台还为广大用户,在视觉应用丰富的今天带来了非常实用的视频优化技术,比如基于AMD Steady Video的视频防抖处理技术,只要在AMD 视觉引擎控制中心中打开AMD Steady Video 选项就可以自动检测系统播放的视频(可兼容任何播放器、任何渲染模式、甚至包括网页在线视频等),通过复杂的算法将视频重新处理后实时渲染出来,最终用户所看到的画面将会是没有抖动、较为清晰稳定的画面。
而”Lynx”平台通过对OpenCL 技术的完美支持,能够对各种视频播放进行更好的优化,诸如对vReveal 视频增强软件(测试视频优化效能)、ArcSoft TotalMedia Theatre 5等的支持。
APU的强大的计算性能还等待我们去慢慢的开发。APU究竟能为我们带来怎样的崭新应用?下面小编就向大家介绍一款由ArcSoft开发的TotalMedia Theatre 5。在完成针对Radeon HD 6000系列的兼容性优化后。它可以实现如下功能:
1、播放蓝光3D立体电影,2D电影实时转换成3D。
2、直接从流行的流媒体网站上播放在线视频。
3、自带媒体管理器(Media Manager),方便快速递管理、浏览和搜索视频。
4、改进的基于OpenCL的SimHD插件,支持降噪,帧率转换加速。
5、智能菜单(Smart Menu),用于DVD和视频文件的浏览、收藏。
6、外挂字幕格式支持:SRT、SMI、SSA、IDX、SUB。
7、视频格式支持:AVS、WTV、MKV(多个音轨和字幕)。
8、音频格式支持:ALAC、WMAL、APE、FLAC、LPAC、OFR。
9、重新设计的影音中心(Audio/Video Center)和直观的用户界面。
ArcSoft正在旗下产品中全面普及OpenCL,比如TMT 5播放器上的视频倍线插件SimHD,TotalMedia ShowBiz、TotalMedia Studio、MediaConverter 7等视频编辑工具上的H.264编码器等等。SimHD已经升级支持ArcSoft自己开发的降噪、动态光照、帧率转换技术,H.264编码器则能调用CPU、GPU等整个系统的硬件资源,而不仅限于CPU。
APU大应用 视频增强:vReveal
vReveal是一款可以让模糊的视频变的更加清晰,让晃动的视频变得更加稳定,让小尺寸的视频变成大尺寸的视频,让颜色不好的视频变成非常漂亮的视频,它就是一款这样的工具。vReveal视频增强软件对APU提供了很好的支持。
另外Llano APU可以实现实时倍线高清技术,AMD通过OpenCL异构计算技术实时将标清内容提升到接近于高清标准同时将海量数据交给更有效率的GPU来处理,然后搭配UVD3高清视频硬解码带来流畅的视频播放,以最少的系统资源消耗。这一技术可以实时将标清内容提升到接近于高清视频的标准,需要配合ArcSoft TotalMedia Theatre搭配SimHD插件实现。
实时的视频增强效果
可以选择多种增强效果滤镜
丰富的设置都依靠APU来实现实时计算
写在最后
AMD全新的A系列处理器,被公认为是一款具有革命性的处理器产品。它首次将CPU和GPU融合的如此紧密——你中有我,我中融你。A8-3850的四核X86处理器倍增的L2缓存以及其强大的HD6550D独立显示核心,在整个测试过程给我们留下了深刻的印象。
在x86处理核心方面,A8-3850的设计非常独特。摒弃了华而不实的L3高速缓存。用更多的晶体管直接加强了L2缓存和独显核心的性能。虽然在CPU单核性能方面,AMD和Intel仍有些许差距。但是其独显核心以及先进的架构和计算处理方式却是异常强大。APU的异构计算架构让其有了制胜的法门和独一无二的特性。不过在未来,AMD需要和更多的软件开发商进行合作。让越来越多的应用软件针对APU的异构计算进行优化,才能发挥出APU真正的实力。
在CPU和GPU的融合方面,AMD走在了Intel的前面。至少在这一代Intel SNB处理器并不能实现真正的异构计算,而且SNB架构内置的HD2000/3000孱弱显示性能和APU内置的HD 6550独显核心相比也确实有很大的差距。当然,A6/A8系列处理器价格仅为117-135美金以下,只是AMD APU面向主流桌面DIY用户的初次亮相,而APU架构将在2012年衍生出真正的高端产品,基于“推土机”核心+更高性能的HD radeon融合而产生的 APU(Trinity),这将把AMD的APU产品带入另外一个高度,让我们拭目以待把!