新浪科技

5.2GHz 史上最强处理器IBM z196解析

作者:小熊在线-宁道奇


5.2GHz:IBM发布史上最快处理器

  近日IBM公布了5.2GHz处理器的特性细节,可以说这是目前世界上最快的微处理器。但国内的发烧友们就不要留有残念了,我敢打赌没人买的起。

  IBM在Hot Chips 2010大会上发布了史上最快的处理器z196,它将被应用于Z系列主机中。如果单颗处理器的成本不超过1万美元的话,那么最便宜的整机的售价将会控制在10万美元之内。IBM将在今年九月全面发布这个系列的产品,不过从7月份开始,已经开始作前期的宣传了。

  IBM声称,再此之前,最快的POWER6处理器可以达到4.6至4.7GHz。这可以看所是上一代处理器频率冠军。在2008年,Z10芯片的时钟速度都在4.4GHz以上。而今天的z196将是最快的微处理器芯片。

  IBM将z196定义为CISC类型的芯片。它允许更大的内存容量,允许运行更庞大的程序,因此在这方面要比RISC有很大优势。包括PowerPC和ARM处理器都属于RISC这样的处理器。

小贴士:CISC和RISC

复杂指令集计算机(Complex Instruction Set Computer,CISC)

  早期的计算机部件比较昂贵,主频低,运算速度慢。为了提高运算速度,人们不得不将越来越多的复杂指令加入到指令系统中,以提高计算机的处理效率,这就逐步形成复杂指令集计算机体系。为了在有限的指令长度内实现更多的指令,人们又设计了操作码扩展。然后,为了达到操作码扩展的先决条件——减少地址码,设计师又发现了各种寻址方式,如基址寻址、相对寻址等,以最大限度地压缩地址长度,为操作码留出空间。Intel公司的X86系列CPU是典型的CISC体系的结构,从最初的8086到后来的Pentium系列,每出一代新的CPU,都会有自己新的指令,而为了兼容以前的CPU平台上的软件,旧的CPU的指令集又必须保留,这就使指令的解码系统越来越复杂。CISC可以有效地减少编译代码中指令的数目,使取指操作所需要的内存访问数量达到最小化。此外CISC可以简化编译器结构,它在处理器指令集中包含了类似于程序设计语言结构的复杂指令,这些复杂指令减少了程序设计语言和机器语言之间的语义差别,而且简化了编译器的结构。

ARM处理器

精简指令集计算机(reduced instruction set computer,RISC)

  是一种执行较少类型计算机指令的微处理器,起源于80 年代的MIPS主机(即RISC 机),RISC机中采用的微处理器统称RISC处理器。这样一来,它能够以更快的速度执行操作(每秒执行更多百万条指令,即MIPS)。因为计算机执行每个指令类型都需要额外的晶体管和电路元件,计算机指令集越大就会使微处理器更复杂,执行操作也会更慢。

z196内部微指令解析

内部微指令解析

  z196中集成了1.4亿晶体管,采用45nm SOI制程工艺技术。核心面积512平方毫米。L1高速缓存具备64KB指令缓存,128KB的数据缓存。每个处理核心,L2具备1.5MB容量。每个处理核心都拥有自己专属的高速缓存存储空间,并且都是可以用于加密操作的。

  在四路节点系统中,L1的总容量达到了19.5MB,采用SRAM,而L2的总容量可以达到144MB。L3则采用eDRAM,总容量达到了576MB。有意思的是,这个系统中还有L4高速缓存,容量为768MB。这些高速缓存层级划分最主要的目的就是尽量减少处理器去访问速度较慢的内存。尽量让多核心处理器处于高速负载状态。

  与上一代相比,这颗芯片支持1079条不同的指令。其中75条指令属于常用微指令,219条可执行微指令,24条有条件微指令。这些指令被统称为Millicode,这算是IBM为z196处理器内部定义的一套微指令集。一个较长的代码指令可以拆分成两个甚至多个微指令指令,如211个中型指令可以分裂成269个双精度指令。

指令处理和内存控制

  z196拥有4个处理核心,每个核心拥有6个RISC,相当于6个执行单元。它包括2个整数单元,2个负载存储单元,一个二进制浮点单元和一个十进制浮点单元。

  在z196芯片中拥有一个板载的DDR3内存控制器,支持RAID配置。就是我们常说的RAIM独立冗余内存阵列。它可以用于从各种故障停机中,恢复期间所发生的数据。同时z196还包括了一个GX总线控制器,可以让其快速访问其他I/O设备。

  在z196中,L4被称作book,z196最大物理内存容量与其安装的book数量有直接关系。理论上来讲每个book可以驱动960GB的物理内存。这样一套四路的系统中就有4个L4,因此总容量达到了3.75TB。而RAIM则会消耗一部分内存容量,因此每个book仍然可以使用高达768GB的内存。由此系统的总内存可以达到3TB。

SC:存储控制芯片

  z196处理器专门为SMP对称多处理器架构而设计,在片上拥有一个SC存储控制芯片。这颗芯片就是传说中的L4高速缓存,配备了96MB的容量。可以为z196提供在多路处理器环境中与其他处理器互相访问共享资源的区域。处理器之间通过SC可以得到48GB/s的数据带宽。SC芯片由1.5亿个晶体管构成,面积为478.8平方毫米,与z196相同采用45nm制程制造,带有8919个互联。

  每一个处理器可以访问两个SC芯片,由此计算四路的处理器系统中总共就有196MB的L4高速缓存了。因此合并起来就是196MB,这也是z196的名字由来。

MCM多芯片模块和LGA-7356接口

  IBM声称可以在其zEnterprise系统中,安装支持z196的多芯片模块(MCM多芯片组件)。每个zEnterprise 196系统中最多可以拥有4个多芯片组件。一个MCM中可以包含6个z196处理器和2个SC芯片,也就是说一个MCM中可以容纳8个超大芯片。由于设计成本问题,不是每一个MCM中都会插满芯片。在zEnterprise 196系统中,可以实现M15、M32、M49、M66和M80等不同规格配置的,每一个数字就代表集成一个z196处理器。当然也可以为用户自定义型号。其余则会用于系统的控制和冗余之用。例如,如果你使用2个MCM组件一个系统。那么其中一个MCM会有20个可以被激活的处理核心。另外一个则会有24个。第一个MCM的4个处理核心被用于系统调度。

  最后要说明的是每一个MCM具备7356个针脚,你可以把他们看做是LGA-7356,这要比目前Intel主流的Core i7使用的LGA1366高出数倍。而一个MCM的TDP可能高达1800W。光这电费就不是一般人能掏的起的。

加载中...