顶点和像素引擎
象它的前辈一样,S3G GammaChrome图形处理器也支持DirectX 9.0规格,并且处理24bit和32bit 浮点精度的Pixel和Vertex Shaders 2.0+。
根据S3图形,顶点和像素引擎的数量是一样的(各为4个),这样可以更好保证游戏性能的平衡性。然而,我们在进行游戏性能测试之前并不敢对此下定论。此外,S18还具有一些秘密武器。下面我们就来看看GammaChromeS18像素、顶点着色引擎背后的秘密:
每周期最大可并行处理16个纹理贴图;
支持双面stencil的容积阴影加速技术;
1条管道采用超低能耗设计;(两个纹理处理单元采用省电设计)
提供电影画质的高精度浮点运算;
高画质的16X各向异性过滤;
提供4X超级采样全屏抗锯齿功能,最大支持1600x1200分辨率;
支持Volume 和cube map,提供相片品质的映射;
支持可编程pixel gamma 修正;
高性能的三线性过滤;
全浮点精度 ALU 单元;
兼顾引擎速度、功效的可编程缓存;
一体化管线设计,支持2D/3D视频无缝转换;
可编程render target混合渲染(PS2.0)
可编程depth shader (PS 2.0)
Zero latency---ultra fast zero cycle clear
最优化Z buffer 读/写
最优化Triangle mask optimization
Fast Clear技术
从上面我们可以看出,S18核心虽然只拥有4条管线,但它的4条管线架构和现在NVIDIA及ATi的不一样。NVIDIA及ATi核心内的管线是每一条管线每一周期只能处理一个纹理,但S18的管线则是每一个管线每一周期可处理四个纹理----也就是每周期最大可以并行处理16个纹理贴图,称为4x4架构,类似于此前NVIDIA GeForce Ti4200所采用的4x2架构。
理论上S18的4x4架构在同一周期下可处理16个纹理,数字上和16条管线等同。在3D世界里,并不是每一个程序都要处理纹理的工作,有时可能只会处理到一些阴影的工作。比如NV40中采用的16×1架构,其16条管线每条管线每个周期可处理一个单纹理,但在没有纹理处理器的情况下核心在处理阴影效果时会调用这些空闲的执行单元来,这样在一个周期内可以处理32个阴影-即32 x 0,而4x4的架构却只能达成8×0。因此在处理阴影效果上S18的4X4架构要逊色于真正的16条管线架构。不过以S18作为中低端显示卡来说,此架构将是目前最强的四条像素渲染管线架构。
目前S3并没有提供更详细与GammaChrome S18和S19系列有关的资料。然而,我们认为它们最大的改进之处是数据缓存系统。我们目前还不确切知道新的S18是否拥有更多的执行单元,然而S3宣称他们改进了此前DeltaChrome中存在的诸多问题 ,并且即将发布的S19系列将会进行更多的改进及优化----它将有8条像素管线。
但我们可以肯定的一件事情是S3在它们的产品上将采用0.11微米制程,这样可以有利于增加芯片的工作频率。架构经过优化处理、拥有更高核心频率 (据说每条管线拥有更多的ALU单元)、4条像素管线的GammaChrome S18 PRO将在中端市场与ATI RADEON X600 PRO相搏杀。相信大家还记得,此前拥有8条像素管线的DeltaChrome S8的性能仅仅达到拥有4条像素管线的RADEON 9600 PRO的水准,不知这次GammaChrome S18 PRO是否仍改变这个历史?
PCT (Percentage Closer Filtering )技术
PCT的意思是当只有一部分的光源照在物体表面,并使之可见,此时就会形成半影(Penumbras),这一部分区域是半暗的(既不是全亮,也不是全暗)。当只有一部分的光源照在物体表面,使之可见,半影(Penumbras)就形成了,这一部分区域是昏暗的(也就是说既不是全亮,也不是全暗)。在阴影贴图中,因为在使用点光源,这个定义就没有意义了。但是我们可以利用PCT这项技术来形成这种介乎于黑色阴影和亮光之间的昏暗阴影。
Pixar工作室的研发人员开发PCF使其能够实现阴影贴图的抗锯齿。NVIDIA更是首次在GeForce3中用硬件加速阴影贴图来实现PCF。PCF通过拿当前的像素深度和阴影贴图中相应的位置的像素深度、以及其在阴影贴图中最近的像素作比较。根据阴影的不同,最终的阴影亮度是测试中的阴影贴图一定百分比。PCF能够成功消除阴影混淆现象,它不能产生十分巨大的半影。这项技术能够通过一个简单的变化实现软阴影。这比仅仅取样临近像素要好,因为在很多场景中我们根本无法完成对相邻象素的采样或者这样的采样将耗费惊人的资源。从这点来看,基于PCT的DST将带来更逼真的光影效果。
Chromotion 2.0引擎
S3在新的S3G图形处理器中引入了第二代可以编程Chromotion引擎。与DeltaChrome Chromotion引擎相比, Chromotion 2.0引擎可以充分兼容DirectX-VA并且能处理任何视频格式:WMV、MPEG-2、MPEG-4/DivX等等。整个Chromotion 2.0由几大部分组成,分别是Pure HDTV、MPEG 2 动态补偿和IDCT加速、WMV9动态补偿加速、Chromotion实时滤镜及ChromoVision。

S18的Pure HDTV技术中的PureFlow功能使得YOV数据可以直接传送到TV编码器中。PureFlow技术增加了视频质量,因为它绕过了YUV数据转化为RGB格式的过程,直接把YUV数据传送到TV编码器中。MPEG-2 硬件IDCT(反向离散)加速解码和动态补偿技术则能明显加快MPEG-2解码的速度和质量。S18采用的MPEG2硬件解码器完全符合微软DXVA标准(事实上这个标准正是当年S3和微软共同推广的),所以我们不必使用特定的软件和工具就能时刻享受到MPEG 2的硬件加速功能。
需要强调的是,YUV数据转化为RGB是一个复杂的浮点运算过程,它能自动判断在转换期间所出现在错误来最终获得最佳的图象显示效果。同时Chromotion 2.0引擎利用Post-Processing Filtering功能将劣质的影像画面(如Web Casting)重整,使画质得以改善。除此之外,其Pure HDTV技术所提供的HDTV播放技术也相当先进,可以完全支持18个ATSC Standards,支持最高1080P Ultimate HDTV,更支持2倍oversampling采样以提高画质,这是NVIDIA及ATi目前还未支持的。