SSE4 (Streaming SIMD Extensions 4) ist eine Befehlssatzerweiterung, die bei AMD seit AMD Bulldozer und bei Intel seit der Penryn-Variante der Core-2-Prozessoren verwendet wird. Der zweite Teil, SSE4.2 genannt, wurde mit der Intel-Nehalem-Mikroarchitektur eingeführt.
Intel SSE4 besteht aus 54 Befehlen. Der erste Teil von 47 Befehlen erschien unter dem Namen SSE4.1. Darüber hinaus erschienen noch einmal sieben Befehle als SSE4.2 ab Core i7 ab der Variante Nehalem.
AMD fügte anstelle dessen mit der K10-Architektur vier eigene Befehle hinzu und veröffentlichte diesen Instruktionssatz unter dem Namen SSE4a. Die Prozessoren der Bulldozer-Mikroarchitektur, die im Oktober 2011 veröffentlicht wurden, unterstützen zusätzlich zu SSE4a auch SSE4.1 und 4.2 vollständig. Intel-Prozessoren unterstützen im Gegenzug die SSE4a-Befehle bis heute nicht.
Instruktionen Bearbeiten
Im Folgenden eine unvollständige Auflistung der neu eingeführten Befehle und ihrer Einsatzbereiche.
SSE 4.1 Bearbeiten
- Skalarprodukt bestimmen –
DPPS, DPPD
- Bedingtes Überblenden –
BLENDPS/-D, BLENDVPS/-D, PBLENDVB, PBLENDDW
- Minima bzw. Maxima bestimmen –
PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD
- Integerumwandlung –
PMOVSXBW/-D/-Q, PMOVZXBW/-D/-Q, PMOVSXWD/-Q, PMOVZXWD/-Q, PMOVSXDQ, PMOVZXDQ
SSE 4.2 Bearbeiten
- Zyklische Redundanzprüfung –
CRC32
- Erweiterte String-Operationen –
PCMPESTRI, PCMPESTRM, PCMPISTRI, PCMPISTRM
Weblinks Bearbeiten
- Extending the World's Most Popular Processor Architecture – Intel-Whitepaper zu SSE4 (PDF, 172 kB, zuletzt aufgerufen am 17. März 2014)
- Intel SSE4 Programming Reference (PDF, 760 kB, zuletzt aufgerufen am 8. Juni 2015)