| | | | | | | [文章信息] | | | 作者: | 姑苏飘雪 | | 时间: | 2004-05-24 | | 出处: | 天极Myhard | | 责任编辑: | 寒冬 | |
| [文章导读] | | | 今天在这里将对比一下NV40与R420技术特性,希望能让大家更详细了解这两款顶级图形芯片的体系架构。 | |
| |
|
| | | |
|
|
|
|
|
|
 R420的像素流水线虽然也是16条,但ATI对R420进行了分组设计:采用4X4组合。上图是ATI为介绍R420架构准备的流程图。从图中我们可以看出图中的16条像素管线被划分成4组,每组各有拥4条像素管线。换句话说,R420实际上并没有16条像素管线,应该是拥有4组像素渲染管线。
在这里要注意,R420像素管线的“4X4”设计与此前nVIDIA的NV30/35/38所采用的“4X2”设计是完全不同的。此前NV30/35/38的像素渲染流水线所采用的“4X2”设计,是拥有4条像素管线,每条管线拥有2个贴图单元。而在R420的像素渲染流水线所采用的“4X4”架构中,每个组中的任何一条管线都能独立工作和拥有各自的资源:材质单元,像素引擎,像素引擎的缓存,临时/常量寄存器、内插纹理坐标、颜色等等。
因此,R420的4组像素管线中的任何一组都能同时处理4个像素:这4个像素被定义为2X2(Quad)块,同时这样的组合能允许隐性采样和样品和纹理过滤延迟。可以说,R420的“4X4”架构的性能要远胜与NV30/35/38的“4X2”架构。这个方案对ATI来说是一个极佳的解决方案,“4X4”式的设计让ATi可以如此灵活的控制管线的开启与关闭,可以根据GPU的品质来停用1组或2组像素管线来推出性能低一些的修正版本GPU,这样可以充分利用现在产能并减少生产成本。
而从实际效果上来说,假若显卡中的某些像素运算器出现了问题,那么表现在游戏画面中并不是我们常见的花屏的情况,而是3D的执行效能适当下降,可以说X800家族的显卡具备动态分配像素管线的功能。同时,ATI宣称关闭像素管线并不会影响HYPER Z HD功能的工作。换句话说,RADEON 9800 SE性能过份下降的缺点不再在X800 SE中出现:当关闭一半像素管线和停用HYPER Z功能后,性能严重下降。
而R420凭借HyperZ HD新增加的功能---Z/Stencil Cache,同样也可以实现每时钟周期内进行32次z/stencil操作,同时R420通过缩小Z-buffer存取潜伏周期、增大内部缓存容量以及优化算法两个方面来提升Stencil Cache的性能。尽管ATi和nVIDIA都表示他们的最新产品可以在一个时钟周期处理32个Z轴数据或是模板处理,不过两者实现的条件就大不相同了。
NV40可以在没有色彩数据需要处理的情况下在每个渲染管线完成2个Z/Stencil处理,而R420则是可以在开启抗锯齿的情况下实现,1个Z/Stencil处理由像素管线完成,1个由多重取样抗锯齿单元完成)。两个不同的实现条件决定了R420在非抗锯齿渲染中只能完成16个,而nVIDIA则需要在不考虑抗锯齿的情况下才能达到32个,而实际应用中也差不多是16个。当然,实际使用中的性能将取决于编程人员以及用户的选择。
|
|
|
|
|
|
|
|