“AMD的SSE3”
AMD在本周正式推出了X52系列Opteron处理器,该系列处理器采用了90nm制程和特别的有机封装(此前是陶瓷封装),HyperTransport频率提高到1GHz,工作频率2.4-2.6GHz,采用了最新的E4步进,也就是加入了对SSE3指令集的支持。
英特尔从奔腾MMX开始就不断推出指令集(MMX、SSE、SSE2等),AMD也会推出他们自己的指令集(3DNow!),并且会在过一段时间才在自己的产品上提供对英特尔指令集的相应支持。这一次AMD这么快就在自己的Opteron处理器上支持SSE3指令集确实让我们有些意外。
 Opteron 252 SSE3是英特尔去年推出Prescott核心处理器时出现的,包含13条指令,是对处理器SIMD能力的补充。处理器有时候会重复处理大量数据和类似操作,大量数据流通过处理器,需要进行的操作则是同一个(特别在音频/视频处理过程)。目前很多显卡核心上都带有SIMD处理单元,用来处理尽快处理大量的顶点、象素数据;CPU中的X87浮点处理部分中也具有这样的专门单元。
SSE3指令集中包括10条针对SIMD的新指令和3条不设计SSE寄存器的指令:
·x87浮点-整数转换指令—fisttp ·复杂算术指令—addsubps,addsubpd,movsldup,movshdup,movddup ·视频编码指令—lddqu ·图形指令—haddps,hsubps,haddpd,hsubpd ·线程同步指令—monitor,mwait
上面给出的13条指令中,浮点-整数转换指令的功能很好理解,但不是所有的指令都这么显而易见。复杂算术指令增加了虚数功能,hadd和hsub指令则是为水平加、减操作准备的。这些指令可以加快顶点阵列中水平存储数据的处理速度。 为了看看加入SSE3指令集后给K8处理器带来那些变幻,我们对比测试了Opteron 252和Opteron 250两款处理器。通过PowerNow!技术,我们将Opteron 252的倍频设定为“12”,使得两者工作频率一致(2.4GHz)。
测试系统为惠普的WX9300工作站,我们采用单处理器配置,提供4×512MB内存(3-3-3-8),安装Windows XP(SP2)操作系统。在多处理器环境中(内存带宽更多),Opteron处理器会因为SSE3的加入具有更大的潜力,不过我们无法实现双处理器配置,PowerNow!在设定超过1块处理器后就会引起系统自检失败(BSOD)。
SSE3性能分析:
在运行测试之前,我们首先通过CPU-Z识别出Opteron 252确实支持SSE3指令集。第一个测试是DivX编码。我们使用的是DivX 5.2.1加AutoGK 1.91前端程序,处理《The Chronicles of Riddick》的19-21章。编码中我们舍弃音频,并将质量设定在75%。
|
|