| | | | | | | [文章信息] | | | 作者: | 姑苏飘雪 | | 时间: | 2004-05-24 | | 出处: | 天极Myhard | | 责任编辑: | 寒冬 | |
| [文章导读] | | | 今天在这里将对比一下NV40与R420技术特性,希望能让大家更详细了解这两款顶级图形芯片的体系架构。 | |
| |
|
| | | |
|
|
|
|
|
预测算法(Predication)的作用则类似CPU的分支预测算法,这个设计来可以提高shaders处理速度。预测算法在多重渲染工作的情况可以猜测究竟是那一部分数据要被送往GPU进行处理,而不是将所有的数据一次送往处理,从而提高GPU的效能。不过现在业界对动态分支的作用存在两个对立的观点。从性能的角度来看,一些人认为这是一个非常有用的功能。然而另外一些人则认为在分支设计思想中对数据处理的方法并不合理,因为NV40的Pixel Shader仍是SIMD体系,在执行动态分支的时候,各分支能获得的资源可能会有不足的可能,性能未必能提高。
 NV40完全支持PS3.0,而R420则只支持PS2.0b,可以说功能上NV40占优。
在临时寄存器数量方面,NV40上升到了32个,这些改进意味着程序员能高效的进行程序开发,这也大大提升了shader的性能。因为像素着色引擎在处理复杂shaders时往往需要更多的临时寄存器,此时如果临时寄存器的数量不够用时,性能就为严重下降。而这正是NV3X架构的通病,所以nVIDIA也大大增加了其NV40的临时寄存器数量。而R420在这方面也有所改进:与R3x0架构相比R420的临时寄存器从12增加到32个,与NV40一样。
在浮点颜色精度方面,NV40仍象NV35/38一样支持FP16、FP32两种渲染模式。R420的像素着色引擎在执行浮点颜色精度方面仍然与其前辈一样:R420虽然支持16bit、32bit浮点颜色精度和提供128bit色彩,但受RAMDAC容量的限制,R420每个色彩通道实际上只有24-bit:即执行时仅仅采用24bit浮点格式,只不过在写入帧缓存时96-bit会被扩充至128-bit。
不过,我们很难从肉眼看出24Bit与32Bit 的分别,而由于24Bit要处理的数量少得多,这亦是为何ATi当年在效能上胜过nVIDIA的原因之一:nVIDIA GFFX系列支持32Bit ,令工作变得繁复。
4、全屏抗锯齿
在全屏抗锯齿技术上来说,NVIDIA一直逊色于ATI。此前,NVIDIA的NV35/38一直采用Supersampling、multisampling、ordered-grid supersampling(简称OGSS)和ordered-grid multisampling(简称OGMS)几种采样方法,但效能一直逊色于ATI的R3X0系统所采用的Rotated Grid Super-Sampling(简称RGSS)。

|
|
|
|
|
|
|
|