在ATI正式发布最新的R420显示核心之前,编辑们对这颗神秘芯片的架构衍生出了蛮多的猜想。随着5月18日R420显示核心以及采用这一核心的X800系列显卡在京正式发布,当具体规格细节展现在人们眼前后,正应了那句经典的台词:“就素那浮云……”
相对于4月先一步推出的NV40显示核心以及GeForce6系列显示卡,ATI的产品在发布上稍许晚了些日子,就在这期间也因此难免引起了人们的各种猜疑,相对R9800XT发布时的场景,甚至有人推测莫非这次R420技不如人要黄了?
这些乱七八糟的猜测,归根到底还是对于R420性能预期的不确定,人们最关心的是它是否像NV40那样,相对于前一代产品会产生质的飞跃,进行一次彻底的革命,抑或仍然仅仅停留在对R3XX架构的改良上。
在开始对X800系列显示芯片的规格作介绍之初,ATI给了广大用户一个相当明确的解释:“Comprisedof160milliontransistors,theybuilduponthehighlyacclaimedRADEON9800architectureandextenditbyprovidingmajorincreasesinbandwidth,parallelism,efficiency,imagequality,andprogrammability.”
这句话中,明确指出了X800系列显示芯片的架构是“基于广受好评的RADEON9800架构并进行了一系列改进以后诞生的一款产品”。那么除了这1亿6000万的庞大晶体管数量之外,R420显示核心相对于R360还有哪些变化呢?我们来看看规格的对比表格
我们看到,这张表格中对比了4款不同显示卡的规格,从中可以直观的看到以下几点:
◎晶体管数目增加
从R360升级到R420显示核心,芯片内部的晶体管数目有了一定的增加,从原来的1亿1000万增加到了1亿6000万,增加了45%。
◎频率进一步提升
我们看到,无论是核心频率还是显存频率,在X800上都有一定提升。X800Pro的频率达到了475/900MHz,而高端的X800XT更是达到了520/1120MHz。这些数值要比NVIDIA的对应产品高上不少。以上频率均为ATI在5月18日中国发布会公布。
◎管线增加
处理顶点数据的Vertex管线数量增加了50%,达到了6条。而像素处理管线,则分别增加了50%和100%。从这两项看,X800XT在管线上的设置和NVIDIA最新的显示芯片GeForce6800Ultra的数目完全一样。
表格中有多项数据对比,但真正吸引我们眼球的却仅仅只有上面这三项,为什么呢?因为其他的项目大部分是理论上的处理能力参数,我们完全可以从频率和管线两个方面来解释。
例如,我们看到新的Vertex管线增加了50%,而频率增加了21.3%。对比看顶点处理能力的时候,用R9800XT的412M/s×1.5×1.21,得出的就是X800XT的750M/s的顶点处理能力。其余的各个处理能力也都可以这样推导。<接下来,我们一起看看X800的架构示意图。
我们看到在新的X800图形芯片内部架构图中,主要包含了以下几个部分。
◎AGP接口成为新一代显卡的瓶颈
首先是负责和CPU通信的AGP接口。这个部分承担着所有和计算机进行数据通信的工作。目前AGP接口的带宽虽然不断提高,但是仍然被认为已经严重影响了显示卡的性能发展。因为相对于显卡内部动辄数以十数GB/s而论的带宽,AGP接口那仅仅2.1GB/s的带宽就显得十分捉襟见肘。
AGP接口将数据从CPU读入以后,将数据传输给显存控制器。后者的作用不仅仅是控制数据在显存中的存储,还承担着显存的数据接口作用。它一共连接着6种不同的功能部件。除了显存本身以及AGP接口以外,它还要负责将数据传输给2D引擎、视频处理引擎以及3D引擎。而其中3D引擎则同时和顶点处理器,以及“HyperZHD”引擎相连接,将数据传输给这些部分。
2D显示引擎和视频处理引擎部分我们没必要多谈了,这两个部分分别负责2D显示的运算以及视频回放处理。它们将数据处理完以后就可以直接将准备显示的数据放进显示接口(DisplayInterface)。
◎复杂的3D处理环节
接下来,我们就进入了最关键的3D处理的一整套环节中了。3D图形处理是按照一定的顺序执行的,最主要的就是先进行几何方面的运算,然后进行像素处理方面的运算。当然,这个过程也不是这么简单的,复杂的3D几何运算过后,还要将这些3D点换算成在屏幕上显示的具体像素,这个过程就是由SetupEngine实现的。
在像素处理管线以后,还要根据需要进行图像的后期处理,在X800图形芯片中,它的后期的图像处理引擎被称为“SmoothVisionHD”。
这些后期的处理过程能够生成实际需要显示的数据,所以它们均将最终的数据传入显示接口,经过一些相对简单的处理以后输出至显示设备。<无论是显示芯片还是CPU,凡是这些精密的芯片,始终都在追求工艺上的提高。从0.25μm,到0.18μm,再到0.13,甚至0.09……生产厂商在这方面的追求从不曾停止。
这次X800采用了0.13μm工艺制造,这比上一代产品Radeon9800的0.15μm制造工艺要提高了一个层次。这一改进最直接的好处就是芯片运行频率提高了100MHz但发热量仍然控制得很好。
代工厂商方面,ATI选择了TSMC作为他们最新产品代工厂商,并采用了最新的Low-K工艺来生产R420显示芯片。
这次的0.13μm工艺采用了铜互连技术。铜由于比铝有更好的延展性和导电性,所以使得在传输信号的时候,能够保证在更细的电路中获得更好的信号质量,而这正是增加频率,提高性能的物理基础。另外,采用更先进的工艺有利于在同样尺寸的晶片上实现更多的晶体管。而晶体管本身就是实现运算的最基本单元。晶体管数目越多,也就意味着芯片能够实现更加强大的功能。
我们前面已经看到了X800显示芯片的架构,这颗芯片在顶点处理管线以及像素处理管线上均有一定程度的升级。其中顶点处理管线增加到了6条,像素处理管线增加到了16条。
我们注意其中的像素处理管线。这16条管线在硬件上是如何实现的呢?ATI公司采用了一个方法,就是将这16条管线平均分为4组,每组4条,ATI将其称之为“块”。这样就可以方便的实现对像素处理流水线的控制了。
ATI这次最新发布的X800系列显示芯片,统一都采用了256bit的显存带宽,这256bit又被分为4个独立的通道,每个通道64bit。对于显存,X800系列显示芯片的标准配置是GDDR3显存,这种显存相比原来的显存来讲,能够运行在更高的频率上。这样X800上的显存数据带宽就能够轻易的达到32GB/s以上了。
我们前面提到,X800系列显示芯片采用了4个独立的内存控制器,但是这并不意味着每一个内存控制器仅仅能控制4个内存模组中的一个。ATI采用了一个用来切换内存控制器和内存连接的装置“Switch”来保证这4个内存控制器和4组显存能够完全自由连接。当然,这个过程中还有一个非常重要的事情就是如何将数据传入内存,“Switch”同时也负责将一个总线控制器和任何一组内存进行连接。<●顶点处理引擎
3D图形运算最基本的单位就是每一个单独的点。因为有这些点,才能根据这些点的坐标计算两点间的线以及三个点形成的面。所以说3D图形处理中几何部分的处理,其实就是对空间中的点进行运算,这也就是为什么人们会将3D图形中几何处理的引擎称之为“顶点处理引擎”。
我们首先来看看X800系列显示芯片中的顶点处理引擎的架构。
我们看到,当顶点的初始数据传入顶点处理引擎的时候,数据被分配至6条并行的管线之中。这6条管线分别拥有一个128位矢量数据算术运算单元以及一个32位标量数据的算术运算单元。数据经过矢量运算以及标量运算以后,并不一定就是最终需要的数据。而且由于矢量运算器和标量运算器的关系是并行的,所以有的需要进行两种运算的数据就需由流程控制器(FlowControl)再次送入前面的运算单元了。
在经过了6条并行的数据运算以后,顶点处理的过程只能说是完成了其中最重要的部分,但是距离数据最终输出还有很远。
接下来进行的过程需要进行遮掩面的选择(BackfaceCulling)、数据整理(Cliping)、透视分离(Perspective)和最后的可视范围变换(ViewportTransform)。经过这4个过程以后,数据就可以输出至将3D数据转换为2D数据的“SetupUnit”了。<●装入引擎(SetupEngine)
Setup,我们最先熟悉这个词的时候一定是在安装软件时候认识的。在3D图形处理中的Setup引擎完成的是一种怎样的工作呢?
在前面进行的顶点处理过程中,所有的顶点都被独立计算它们的位置。然而在实际的3D模型中,却不能够以纯粹的点来表示3D模型,更多时候需要借助两点间的线以及三个点围成的面来实现,所以将点和点之间的联系省略俨然是不可取的。
Setup引擎的作用就是将这些独立的点再次结合到一起,组成最基本的三角形。因为任何多边形的最基本的元素就是三角形,所有复杂的多边形均可分离成为大量独立的三角形。
Setup引擎的具体架构分为两个部分,首先是几何汇集(GeometryAssembly),这个步骤的作用就是将独立的点重新连接成一个个三角形。第二步就是Setup单元,这个部分完成的工作就是将一些作用在三角形上的函数分派至具体的三角形上。
在上图中,Setup引擎首先将独立的点连接成为三角形,然后将三角形安排在很多的块中,然后根据顶点在这些块中的位置来确定怎样对三角形进行处理。<●像素处理引擎
3D处理过后,我们就要进入2D处理的环节了。这里称之为2D,并不是和前面我们提到的2D处理引擎相同。这里是指将3D运算结束以后,在像素级别进行的处理过程。这个过程我们也已经非常熟悉了,这就是经常被提到的PixelPipline(像素处理管线)。
X800系列显示芯片的像素处理管线一共有16条,这比原来的R9800XT上的8条增加了一倍,这就意味着在理论上,即使频率保持不变的情况下也能有一倍的像素处理能力的性能提高。
我们看到在这16条管线上,ATI采用了4组4条的设计。这样的设计不仅可以更加有效的控制管线条数,也可以保证在其中一条失效的时候,不至于被迫放弃整个芯片,而仅仅屏蔽掉其中的一组就能作为X800Pro或者标准版来出售了。
我们看到,在像素处理的环节,其复杂度远远超过了前面的顶点处理部分。因为在一个场景中每时每刻都要运算的数据点是海量的,而且这些点包含的信息也绝不仅仅是一个坐标而已。它还包括颜色、亮度和其他点的关系在内的各种数据,这些都要进行不断的运算。这也是为什么在像素处理部分的管线需要16条,而顶点处理部分则仅仅用6条的原因。<我们前面介绍了X800系列显示芯片在架构方面的一些情况。这些架构层次上的情况基本上可以算是硬件结构,它们是发挥产品效能的一个基础。那么如何才能将这些管线以及各种各样的单元发挥出最大的效果呢,这就需要相应的技术作为支持。X800系列显示芯片诞生的同时也是ATI展示最新技术的一个绝好机会,我们就趁此来看看随X800而来的各种新技术应用。
在X800发布的过程中,ATI发布了以HighDefinitionGaming(高画质游戏)为主题的一些最新的技术,其中包括:
·SmartShaderHD·SmoothVisionHD·Hyper-ZHD·3Dc
首先,我们来看看X800系列显示芯片中带的SmartShaderHD技术。对于SmartShader技术我们已经非常熟悉这个名称了,早在Radeon8500发布的时候,ATI就推出了他们的第1代SmartShader技术,这次推出的SmartShaderHD是其第4代技术。
SmartShaderHD技术本身其实是一个技术的合集,其中包括了关于顶点处理引擎以及像素处理引擎的技术,其名称中“Shader”正是VertexShader和PixelShader中的“Shader”。
●VertexShader方面的改进
VertexShader这个名字的出处来自于DirecX规范,其本意是一组针对顶点处理的函数的集合,显示芯片厂商在研发显示芯片的时候,将这些功能用他们的显示芯片在硬件中实现。
SmartShaderHD技术能够很大程度提高VertexShader的性能。由于增加了顶点处理管线的条数,并且能够在每个时钟周期中进行两次操作,在数据的精度方面X800支持32位的精度。
顶点处理能力的增强主要会体现在一些几何运算量非常大的情况中。例如波涛起伏的海面上拥有大量的三角形,采用最新的X800显示芯片进行运算的时候就能很大程度上提高速度。
●PixelShader方面的改进
相对于面向顶点坐标运算的VertexShader,PixelShader的作用则是面向像素的处理,也就是最终显示在显示器之前的画面处理。
同样的,由于管线条数的增加,PixelShader的能力有了大幅的提高,X800系列显示芯片最高能在每秒钟完成400亿条像素的运算操作。这些操作完全支持了DirectX9.0中数据格式24位精度的要求。
对于程序中指令的长度,SmartShaderHD也有一定的改进。在R360时代,每个PixelShader程序的指令最大长度仅仅为160条,而到了X800上,则可以支持1536条指令。<●虚拟位移贴图(VirtualDisplacementMapping)
虚拟位移贴图技术是一种效果非常好的准3D技术,为什么说是“准”呢?因为这项技术类似于法线贴图(NormalMapping),并没有像位移贴图(DisplacementMapping)那样实现真正的3D效果。这种技术主要依靠后期的PixelShader来将贴图进行一些局部形变,再配合阴影效果来实现3D效果。这种技术比起传统的凹凸贴图以及法线贴图有更好的效果,但是又不会像位移贴图那样消耗过多的几何处理能力,所以这种技术可以说是一种结合位移贴图技术和法线贴图的优点的技术。
X800凭借其支持的SmartShaderHD技术,在虚拟位移贴图上能够实现比较好的效率,从而在消耗资源很小的情况下得到了非常好的效果。
●高动态范围(HDR)
高动态范围的效果我想大家也已经有所了解,这种技术的主要目的就是通过更高的精度来表示细节,这样就能够让计算机表示的动态范围不再仅仅局限于255级,而是更加接近人眼能够分辨的范围。
ATI这次推出的X800系列同样支持了高动态范围技术,我们可以看到图中高亮的部分仍然保持了相当丰富的细节。<●景深效果(DepthofField)
稍微有些摄影基础的朋友一定都非常熟悉“景深”这个词了。如果非要解释这个词的话就是“在摄影机镜头或其他成像器前,沿着能够取得清晰图像的成像器轴线所测定的物体距离范围”。说得再简单一些,就是距离不同的景物,呈现出有些地方清楚有些地方模糊的效果。这种效果能够更加突出需要反应的焦点,让画面的主题更加鲜明。
我们观察上面的两张图片,就能非常明显的看出景深的效果。在第一张图片中,手持长棍的忍者是清楚的,后面的景物时模糊的。而在第二张图片中,焦点移到了后面的景物上,前景的忍者反而变成了模糊的效果了。这样的效果更符合人肉眼对自然环境观察的结果,也就因此令玩家的感受更真实。<在日常生活中,我们见到的影子通常都不是非常锐利的。而现在X800图形芯片也可以实现这样的“软阴影”的效果了。我们看如下的图片,Ruby的头发在脸上形成的影子,左边的影子十分锐利,而右边的影子边缘已经是模糊的了,这种效果和我们实际生活中的视觉体验非常相似。
产生这种现象的最根本的原因就在于光源。在实际生活中,我们见到的光源几乎不存在真正意义上的“点光源”。无论一个光源多小,它都是有一定的面积的。但是在计算机图形中,情况却是相反的。在电脑的运算中,不可能有一个真正的面光源或者是线光源,所有在计算机中的光源全部都是点光源,即使是用多个点光源模拟线光源或者面光源也是非常难于实现的。
那么ATI怎样在Ruby的脸上实现了软阴影的效果呢?答案是他们采用了贴图的方式,将阴影层贴图的边缘模糊化,然后再贴到Ruby的脸上,最终实现了软阴影的效果。<●复杂的折射和反射
在X800支持的SmartShaderHD技术中,可以让非常复杂的光的折射和反射都能够得到满意的解决,在《DoubleCross》的演示Demo中,一颗五光十色的钻石成为了整个Demo的主线。ATI在这颗钻石上采用了非常复杂的光的折射和反射技术,使得效果和实际非常接近。
我们看到,在钻石表面的处理上,对于折射和发射的效果做的都非常逼真。
●次表面散射技术
次表面散射技术的主要作用,是在某些特定场景中,针对需求营造出一种半透明的效果。
●体积光效果
不知大家是否还记得侯宝林大师有一个著名的段子叫做《醉酒》,其中的一段经典的台词便是在夜里打开手电往空中照,便能显现出一道光柱来,这就是体积光。由于在理论中,光在途中并不会被人发觉,只有通过了有灰尘或者烟雾的环境中才能由于散射被人们所看见。
SmartShaderHD提供了模拟这一现象的能力,使得光线显得更加逼真。以后在游戏中见到这样的场景您就会对它有更深刻的印象了。<●SmoothVisionHD
ATI的SmoothVisionHD技术同样是一个有着一定历史的技术,发展到X800的时代就多了一个“HD”的后缀。SmoothVisionHD技术只要面向的是后期的图像的处理,这里面包括了抗锯齿、伽马校正和材质过滤等多种技术。
对于SmoothVisionHD中支持的抗锯齿方面的技术,绝大部分是和目前已经被广泛采用的技术类似的,所以在这里我们就没有必要再说那些事情了。值得注意的是在X800系列显示芯片中,首次增加了一种全新的抗锯齿采样方式,这就是近期大家讨论非常多的TemporalAnti-Aliasing(临时取样抗锯齿)。
●TemporalAnti-Aliasing
这种全新的抗锯齿的原理是这样的:
每一帧采样的位置不同,连续两帧的取样位置也不同。这样就能够在两帧来回切换的时候,利用人眼的视觉暂留特点,实现接近于两倍原有取样的效果。但是这个过程由于每一帧的取样点数并没有提高,所以在性能上将不会有任何下降。
另外,这种技术产生的抗锯齿的效果只能由肉眼看出来,如果进行抓图的话,仍然将截取到其中的单一帧,所以通过截图是看不出这种“临时采样”的抗锯齿效果。<●伽马校正
这项技术有助于弥补在抗锯齿的过程中,线性分配伽马值所带来的细节损失,使图像细节更加丰富。我们可以清楚地注意到,在没有采用伽马校正的情况下,暗部细节不容易显现出来,而采用了这一图像增强技术以后,图像的层次更加明晰了。
●材质过滤
SmoothVisionHD技术在材质过滤方面也有着不错的表现,其最高支持16X的各项异性过滤是高画质图像显示的重要的一个环节。
●Hyper-ZHD技术
Hyper-ZHD技术是一种用来减少资源浪费的一种技术。我们知道,如果要在画面上实现某个3D的图形,就必须知道这个图形到观察者的距离。存放这个距离的就是我们常常提到的Z轴缓冲(Z-buffer)。
在实际的运行中,Z轴缓冲需要被不断的进行运算,并且不断的改写。这个过程对于显示芯片来讲也是一个考验。Hyper-ZHD技术的目的就是减少Z-Buffer所占的空间,从而达到提升性能的目的。
Hyper-ZHD技术是由多个不同的技术所共同实现的,其中包括:
HierarchicalZEarlyZTestZCompressionZ/StencilCacheFastZClear
在本次接近尾声的时候,我们开始陆续收到多家厂商送来的X800。但华硕的这款产品,是本次评测最早收到的第三方厂家显卡,也因此成为本文的测试主角。<本次RadeonX800Pro的测试平台如下:
硬件系统
处理器
IntelPentium43.4EGHz[800MHzFSB]
主板
华硕P4P800[865PE芯片组]
内存
ApacerDDR4001GB[512MB×2]
硬盘
SeagateBarracutaⅤ60GB
显示器
爱国者998FD
电源
鑫谷核动力合金版实标400W
驱动程序
主板驱动
IntelChipsetInf5.1.0.1008
显卡驱动
NVIDIAForceware61.11withoutWHQL
ATICatalyst4.5WHQL
操作系统
英文WindowsXP+SP1
作为对比,我们使用了一块GeForce6800U降频后得到的GeForce6800GT作为对比,之所以我们采用这种方法,是因为GeForce6800GT在硬件规格上处理管线没有任何缩减,只是将频率降低,所以降频后的GeForce6800Ultra和GeForce6800GT是完全相同的,这也是我们采用这种方法的原因。
与我们以前的测试平台相比,本次测试在以下方面有所改变:
●首先,我们和之前的大多数测试不同,采用了目前Intel最新的处理器,Prescott内核的P43.4GHz,而我们之前使用的通常是Northwood内核的3.0GHz的Pentium处理器。采用这颗处理器的主要考虑是CPU主频的原因,为了能够尽量减小CPU子系统对整个系统的影响。
●内存方面,我们在这次的测试平台上使用了1GB容量的内存,这相对我们一贯使用的512MB容量而言一个重大改变。我们这次采用了Apacer(宇瞻)的两条512MB的DDR400内存,采用的内存时序设置为6-3-3-2.5。
GeForce6800GT的核心与显存频率分别350MHz/1GHz,而对应的RadeonX800Pro则为475MHz/900MHz。二者可谓互分胜负,此外从规格上讲,R420核心并不支持ShaderModel3.0,它仅支持到PixelShader2.0与VexterShader2.0,这也可以算是R420的“硬伤”了。
在本次测试中,我们的起点依旧很高,因为考虑到CPU已成为瓶颈所在,所以多数测试均以1600×1200的分辨率开始,并且加入了各级的FSAA与AF,以做到榨干显卡的最后一滴“油水”。此外,为了顾及到大部分玩家依旧采用1024×768等分辨率进行游戏,我们在个别测试中也加入了诸如1024×768和1280×1024分辨率下的测试,以求将全方位的将评测信息呈现给您。
我们的测试项目共有12项,分别为:
◎综合Benchmark测试部分
AquaMark3、3DMark03Patch340;
◎游戏及专用软件测试部分
可能有些朋友会发现,为什么本次X800Pro的测试中没有看到UT2004的身影?实际上,在我们此前对6800U的评测中,UT2004的表现就不是十分不稳定,每次测试的分值差异都很大,需要将多次测试的数值加以平均方可采用。这也表明了目前UT2004自身还存有一些问题有待于改进,因此在本次测试中,我们毫不留情的将它砍掉。<对于AquaMark3这款测试软件,广大读者想必已经相当熟悉了。AM3是全球首款提供了真实DirectX9游戏引擎的商用测试软件,测试成绩较为公正,被各评测实验室广泛采用,已经成为目前最为通用的一款3D图形测试软件。
这次我们在AquaMark3的测试中重点考察3项测试:标准得分测试,1600×1200分辨率下打开4×AA和8×AF的测试,以及像素填充率的测试。
可以看到,每项测试6800GT均取得了领先,不过幅度并不是很大,大多维持在5%左右。即使在最大分辨率以及最高画质的情况下,X800Pro也仅仅落后不到2帧。这样的差异在实际运行当中并不会有明显的感觉。<3DMark这款测试软件的“悲惨命运”我们已经非常熟悉了,因为该款软件在人们心中的地位,所以造成了爆出不少关于有些显卡在这款软件中作弊的消息。但NVIDIA最新驱动的测试成绩得到了3DMark官方的认可,而ATI也同时获得了X800系列支持3DMark的最新补丁,所以我们没有理由不测试它。
在3DMark03中,6800GT领先的优势逐渐显露出来,并且自始至终维持在20%以上。<前面我们进行的3DMark03的测试中,均是基于4个游戏场景测试的部分。为了能够更加全面的反应一款显卡的性能,我们还进行了3DMark03中提供的特效测试。
●像素填充率测试中的单纹理贴图
●VertexShader测试
●PixelShader测试
●Ragtroll测试
6800GT依然在大部分测试中保持优势,但在VertexShader的单项测试中,却一反常态被X800Pro得到了第一次反超的机会,而且领先幅度接近20%。 我们进行了HighQuality模式下3种分辨率的测试,此外我们也打开了FSAA与AF。 毫无疑问,CPU在这里又一次制约了显卡性能的发挥。在常规分辨率下,6800GT只有10帧左右的领先优势。但随着分辨率的增加,两块显卡之间的差距也逐渐显现了出来,在1600×1200分辨率的环境下,6800GT的成绩依然接近400帧,但X800Pro则略现疲态,以落后50fps的成绩居于其后。<我们接下来再进一步的对GeForce6800Ultra来进行全屏抗锯齿能力的测试。 和前面的情况十分类似,高分辨率下,两块卡的差距显而易见。<在进行过全屏抗锯齿的性能测试以后,我们再将目光集中在GeForce6800GT在处理各向异性过滤时的能力。和前面一样,我们同样采用了3种不同的分辨率。 在高分辨率环境下,X800Pro被落下了100帧之多。这样的差距就太明显了。<既然全屏抗锯齿和各向异性过滤都不足以难倒“神奇”的新一代显卡,我们决定一起上,在3种不同的分辨率上同时加载这两项特效。 53→107→100,这是次第在3个分辨率下6800GT与X800Pro之间的差距。这也再一次证明了NVIDIA在OpenGL方面的强大实力。两款显卡目前各自的官方报价都是399美元,这样的性能差距如何是好。<作为移植自XBOX上的大作,Halo在画面方面也使用了一定的DirectX9特效。尽管游戏的移植工作存在一些瑕疵,画面效果相比其它同期推出的DX9游戏也显得稍逊一筹。但作为一款号称拯救了XBOX的游戏,本身的可玩性还是很高的。加之游戏还附带了十分方便的timedemo测试功能,自然也成了我们显卡测试的工具之一。 本次评测我们加上了1024×768分辨率下的测试,此外,1600×1200的分辨率当然也要得以保留,并且将各向异性过滤的等级开到各款产品共同达到的最大值——8×。 与Q3A中6800GT压倒性的胜利相比,在Halo二者几乎难分高下,X800Pro也仅以微弱的劣势落后于6800GT,2~3帧在实际应用中也几乎可以忽略不计。 SplinterCell这款游戏最出色的就要数它的光影效果了,其复杂真实的光影投影效果让很多显卡在这款游戏上都显得力不从心。 随着分辨率的上升,两款显卡的表现也同步改变。虽然还是有所落后,但X800Pro这次紧紧咬住GT不放。在每一个单项测试,6800GT均保持着5帧左右的领先优势。<以华丽画面著称的“虚幻”系列游戏一直备受FPS玩家们的推崇,而UT2003在多人对战模式所取得的成功,更是让这款游戏走向了韩国,走向了WCG的竞技场,让全世界更多的玩家所熟知。 同时,UT2003在显卡测试领域里也树立起了自己的威望,Flyby、Botmatch这两个针对性和侧重点各有不同的项目几乎已成为衡量DX8.1性能的一把标尺,而在全世界的硬件评测室得到了广泛使用。它的测试结果也具备相当的参考价值与权威性。 在Flyby和Botmatch两个测试中,前者最早来自于UT2003多人对战前的地图预览。游戏通过对地图预览帮助玩家熟悉环境(地形和武器分布等等),久而久之变演化成了UT2003的一项测试程序。而Botmactch通过模拟一个多人对战场景,在相对固定的环境中生成了大量的多边形。人物间彼此的射击、命中、血光四溅……都使得显卡的负荷明显提升。在这个过程当中,便可以考察一款产品的运算处理性能。 在Botmatch模式下一对冤家依然难以拉开差距,这种情况在Flyby下则完全不同,可以看到,它们的差距比较明显。<让我们看看在更高画质的情况下,两块显卡的表现如何: 在1600×1200的分辨率中,在打开AF的环境下,ATI向人们展示了它在各项异性过滤方面的过人之处。“全线飘红”是我们在这里对X800Pro的概括。可以看到,每一单项测试X800Pro均取得了不同程度的领先,不禁令人刮目相看。<德国游戏开发小组EgoSoft曾在1999年推出过一款飞行模拟类游戏《X:BeyondtheFrontier》,而本次用于显卡测试的X2RollingDemo则是该款游戏的最新续作。作为DirectX9的测试项目,我们在本次评测中也将这款游戏列入其中。 对于X2的测试,我们仅选用了1600×1200的分辨率,同时打开4倍的全屏抗锯齿与8倍的各向异性过滤,下面请看实际的测试数据: 在这款基于DX9的游戏中,6800GT可建立起约15%的的优势。<与曾经轰动一时的《马克思·佩恩》相比,续作《马克思·佩恩2——马克思·佩恩的堕落》的声势显然小了许多,但诸多特效的应用与华丽的画面表现,仍使它不失成为一款优秀的显卡测试软件。 由于游戏没有提供录制demo的功能,所以我们选择了Fraps2003这款工具,通过两个过场动画来完成测试,而我们所使用的游戏版本为1.0。 可以看到,在《马克思·佩恩2》的测试中,6800GT与X800Pro的差距相当小,总体上可以把这些差距忽略过去。除去在打开4×FSAA的状态下,demo2中6800GT的优势比较明显外,其余的测试二者基本持平。<曾经风靡一时的“波斯王子”系列如今由育碧公司推出了最新作——“时之砂”,它绚丽的画面效果和极强的可玩性给这款古老的系列游戏带来了新的活力和如潮的好评,它也顺理成章的成为我们选择的测试游戏之一。 我们测试使用《波斯王子·时之砂》的1.3.0版本进行,测试工具为Fraps2003,测试时关闭游戏音效。 与《马克斯·佩恩2》一样,我们同样采用测试两段过关3D场景动画(demo1,demo2)平均帧数的方法进行。我们使用游戏在“DidImeetherbefore”存盘点中的两段过场CG,以下为测试结果。 我们看到,6800GT在所有的测试项目中均一路领跑,只是领先的幅度波动较大,最大可拉开30帧以上,而最小只有1帧。<《柯林·麦克雷拉力04》(简称CMR4)是一款近期刚刚推出的赛车游戏。这款游戏以其绚丽的游戏画面以及出色的操控感赢得了众多赛车爱好者的青睐。这款游戏虽然仍然不是一款支持DirectX9的游戏,但是其场景复杂,赛车的表面光泽,车尾的烟雾效果都非常好,而且耗费显卡资源也比较高。 我们的测试采用了Fraps来进行测试,测试方法我们学习了tom’shardware的经验,不仅能够方便的测试,而且测试结果的误差也控制得比较好。 我们的测试直接采用了1600×1200分辨率,并且交替测试了打开全屏抗锯齿以及各项异性过滤时的情况。 FarCry这款游戏的剧情大致是一位名叫JackCarver的退伍(美国的?特种兵?军官?雇佣兵?网上的说法很多,也不知道信谁的,反正是个有军方背景的人啦),在南太平洋的一个群岛做租赁快艇的生意。一天,被一个人租船到另外一个岛的时候,发现这个岛已经被人改造成为一个军事基地,而这里正是恐怖分子研究生化武器的基地,主人公随即被卷入一场精彩刺激的冒险旅程中。 关于FarCry的测试,我们直接将分辨率设置在1600×1200,分别对比这两款显卡在不同的FSAA和AF级别的表现。要说明的是这款游戏的FSAA有4级,我们选择测试了最高的High和最低的None;AF有3级,我们选择测试了最高的4级和最低的1级。 在仅打开4×AF的状态下,X800建立起了自己的优势,不过随着FSAA的开启,这一优势变得荡然无存。 这款测试软件的测试项目非常繁多,两块卡能够共同运行的测试一共有15个。 ●DirectionalDiffuseLightning ●DirectionalPhongLightning ●SpotPhongLightning ●DirectionalAnisotropicLighting ●FresnelReflections ●EnvironmentMapping ●SelfShadowingBumpMappingwithPhongLighting ●BumpMappingwithPhongLighting ●FurShaderShells+Fins ●ProceduralWoodShader ●RefractionandReflectionShaderwithPhongLighting Shadermark的测试表明了6800GT在Shader部分的优势,它在大多数测试中均保持了领先。<我们的这次测试也安排了画质的对比,并且制作了对比用的gif图片供大家自己考察。我们采用了AquaMark3测试中的第150帧和第4000帧作为对比用的截图。 画质测试统一采用了1600×1200分辨率,并且开启4×FSAA+8×AA的设置。其中除X800Pro的截图是这次最新截的图片之外,其余显卡的截图和我们上次在测试GeForce6800Ultra时的图片是一致的。 ◎AquaMark3中第150帧的截图 我们看到,在画质方面,我们看到,X800Pro的画质表现和R9800XT的画质表现惊人的一致,我们如果挡上说明的文字的话甚至不能发觉两帧之间变化。 在FarCry的截图对比中,由于我们采用的是手动截图,所以不能保证截图的位置完全保持一致,但是还是能够看出,在4张对比的图片中,两块NVIDIA的显卡和两块ATI的显卡呈现出了非常明显的区别,NVIDIA的显卡在远处山石上的细节更为锐利一些。<大家看完我们的这篇技术评析加性能评测以后一定对ATI最新的X800系列芯片的最新技术以及X800Pro的性能有了一定的了解。 ●技术部分,领导者为何选择保守? 首先从技术的方面看,我们对这款ATI最新的显示芯片并不是十分满意.这是因为虽然渲染管线的数量有了大幅度增加——和NV40一样增加到了6条顶点处理管线和16条像素处理管线,升级的积极意义是显而易见的——但是我们却发现除了这些管线的增加以外,几乎找不到其它真正的硬件层面的架构升级。从这一点而言,R420更像是R360的大幅增效版,而不是一款从架构上有彻底革命性领先的芯片。 最令我们感到不解的是R420针对未来必然成为主流,已经得到DirectX9.0c明确支持的PixelShader3.0和VertexShader3.0并没有提供。虽然在当前这一标准在实际应用中还远未普及,但以ATI一向重视技术领先的风格而言,却颇为背道而驰。因为我们回首看前几代显示芯片的发展,会注意到ATI始终是支持最新技术的领先者,而这次在ShaderModel3.0的问题上,ATI的选择令人迷惑。 关于这个问题ATI官方的说法是,目前的游戏还没有发展到足够让ATI做些什么的地步,即使是ShaderModel2.0支持的游戏也是寥寥无几。诚然,这一点我们也承认,因为即使是今年开春的游戏大潮,真正支持DX9的游戏也只有《FarCry》一个。 然而,ATI这种“不作为”的态度却引起了大家的讨论。有的人认为ATI这次并不是不愿意做到支持ShaderModel3.0,而是在研发R420之初没有预料到整个趋势的发展势头如此之快——或许对ATI而言,按原计划要到R423或者更后面的产品才对3.0作出支持,而NV40的出现无疑打乱了这个计划。也有人说那些技术其实真的没什么用,而且ShaderModel3.0也不是为了提高画质而来的,NV40支持的那些新技术也都是距离实用非常遥远的事情。 不论怎样,如果给ATI这次交来的作业在技术革新层次上打个分的话,我想假如以NV40为100分的基础,我会给ATI打上85分。考虑到ATI仅仅是对R3XX架构进行改良,就能取得如此成绩,80分以上的结果是很不容易的。 ●性能部分,价格还是性能,没有绝对的公平 客观的讲,我们的这次测试由于没有最高端的X800XT白金版的参加而有些遗憾。不过我们使用了拥有12条管线的X800Pro和NVIDIA阵营的GeForce6800GT来和这款产品对比,从排兵布阵的角度还是公平的——两者的市场售价一致,消费者在同样的投资下将对此作出抉择。 当然,事事都不会是完全公正,因为X800Pro的管线相对于优异版本有了25%的缩减,其像素处理管线由16条缩减为了12条。 通过性能的对比我们还是可以发现一些规律。首先,总体上讲,GeForce6800GT体现出了非常强大的性能,在绝大部分测试中均以非常明显的优势领先于对手。这和它拥有的16条像素渲染管线不无关系。 再者就是ATI仍然保持了在各向异性过滤上的成绩领先,在一些高分辨率下,当AF等级非常高的测试时,ATI的X800Pro通常能够表现出更好的性能。 另外,在一些项目中,X800Pro也体现出了非常不俗的实力,例如在UT2003、FarCry以及ColinMcRaeRally04这些游戏中,X800Pro的表现还是相当令人满意的,在一些各向异性过滤等级开到8级的项目中甚至超过了GeForce6800GT。<在18日ATI正式发布RadeonX800系列以后,我们PCPOP又收到了多家厂商送测的RadeonX800Pro的显卡,他们包括迪兰恒进、七彩虹、翔升、铭瑄、斯巴达克、昂达、海创、蓝宝再加上之前华硕送测的那一款,在PCPOP评测室同时云集了9款RadeonX800Pro。 由于第一批发布和展示的RadeonX800Pro都是ATI原厂的产品,所以实际上各家的产品在设计、用料、做工方面都几乎是一致的。经过对比所发现的差异,也仅仅在风扇散热器的大小、电源接口以及有无独立的视频控制芯片上。为了让广大的硬件爱好者能够先睹为快,评测室准备了很多高质量的精美图片。下面就让我们来一块块的近距离审视这些显卡。 ◎迪兰恒进RadeonX800Pro 作为A卡系的著名厂商,迪兰恒进的产品无论在做工,还是性能上几乎都没有人置疑。这次他们推出的RadeonX800Pro显卡采用了很具创意的包装,在配件方面也非常的全面,随机赠送的光盘中有一套完整版的《HitManContracts》。这套游戏的市场零售价格为49.99美元,这一点大家从书包外的宣传画上就可以看出。<在发布会之前的17号,七彩虹镭风X800ProCH版就悄然摆上了北京鼎好电子商城的形象店。 斯巴达克惊天镭X800Pro的各个方面都与ATI公版的样卡完全一致,属于完全标准的产品。对于这种产品,已不需要编辑在多讲些什么了,大家点击放大看图片吧。<在19号,我们评测室收到了昂达方面送测的RadeonX800Pro显卡。 昂达RadeonX800Pro是到目前PCPOP收到的唯一一块没有正式包装的裸卡。而正是这块裸卡,让我们看到了一些在其它RadeonX800Pro上没有看到的东西:如上图中黄色的电源插口,PCB背面的“ATIRageTheater”的视频输入输出控制芯片。<伴随着18日ATI的发布会,铭瑄的产品线中也多了一款目前A卡系规格不凡的产品——狂镭X800Pro。 铭瑄的狂镭X800Pro也是一款完整包装、蓄势待发的产品。从PCB背面的标签来看,这款显卡和翔升的镭神X800Pro一样,也是打着“MADEINCHINA”的字样。此外,这款显卡还附送《反恐精英》的最新版本——《零点行动》。<海创是去年以来不断出现在显卡用户面前的一个新品牌,这次他们也送测了一款黑鲨RX800Pro劲镭版。 显卡这方面已经没有什么好介绍的了。不过这款产品随卡附送PowerDVD和《古墓丽影·黑暗天使》,编者从蓝宝方面得到消息,这款显卡将周末正式上市销售,价格为3999元,有兴趣的朋友可要留意了。