www.wikidata.de-de.nina.az
Der Intel Itanium ist ein 64 Bit Mikroprozessor der gemeinsam von Hewlett Packard und Intel entwickelt wurde und 2001 erstmals auf den Markt kam Entwicklungsziel war eine Hochleistungsarchitektur der Post RISC Ara unter Verwendung eines abgewandelten VLIW Designs Der native Befehlssatz des Itanium ist IA 64 Die Befehle der alteren x86 Prozessoren konnen nur in einem sehr langsamen Firmware Emulationsmodus ausgefuhrt werden Daneben bestehen Erweiterungen zur leichteren Migration von Software die fur Prozessoren der PA RISC Familie entwickelt wurde Nachfolger ist der Itanium 2 Itanium gt gt Logo von Intel ItaniumProduktion 2001 bis 2002Produzent IntelProzessortakt 733 MHz bis 800 MHzFSB Takt 133 MHzL3 Cachegrosse 2 MiB bis 4 MiBFertigung 180 nmBefehlssatz IA 64 IA 32 Emulation Mikroarchitektur ItaniumSockel PAC418 Slot M Name des Prozessorkerns Merced Inhaltsverzeichnis 1 Design 2 Implementierung 3 Probleme 4 Modelldaten 4 1 Merced 5 Nachfolger 6 Siehe auch 7 Weblinks 8 EinzelnachweiseDesign Bearbeiten nbsp Intel Itanium Funktionsblockschaltbild nbsp Itanium Altes Logo nbsp Itanium CartridgeDie Post RISC Architektur des Itanium Designs nennt sich Explicitly Parallel Instruction Computing EPIC und ist eine Variante der VLIW Architekturen Die Besonderheit von EPIC besteht darin dass die CPU ausgewahlte Instruktionen paarweise laden und auch gleichzeitig ausfuhren kann praktisch so als ob es mehrere vollig unabhangige CPUs gabe Die Instruktionen passend parallel ausfuhrbar zusammen zu bundeln ist eine nicht triviale Aufgabe die hier bereits der Compiler optimal losen muss Daher kommt dem Compiler bzw dessen Optimierungsfahigkeiten eine besonders wichtige Bedeutung zu Das Design verlagert also einen Teil der Komplexitat weg von der CPU und hin zum Compiler Weiter verwendet die CPU ahnlich wie RISC Prozessoren nur eine kleine Zahl von Instruktionen die sehr schnell ausgefuhrt werden konnen Der Itanium verfugt wie die meisten modernen CPUs uber mehrere parallele Funktionseinheiten eine Voraussetzung fur EPIC Beim Laden und der Weitergabe der Instruktionen an die Funktionseinheiten unterscheidet sich der Itanium jedoch von der RISC Philosophie durch den explizit parallelen Ansatz In einem traditionellen superskalaren Design untersucht eine komplexe Dekodierlogik jede Instruktion vor ihrem Durchlauf durch die Pipeline Man spricht von dynamischem Scheduling Es wird gepruft welche Befehle parallel auf unterschiedlichen Einheiten ausgefuhrt werden konnen Die Instruktionsfolgen A B C und D E F beeinflussen sich nicht gegenseitig sie konnen daher parallelisiert werden Die Vorhersage welche Befehle gleichzeitig ausgefuhrt werden konnen ist jedoch oft kompliziert Die Argumente einer Instruktion hangen vom Resultat einer anderen ab jedoch nur wenn auch eine weitere Bedingung wahr ist Eine leichte Modifikation des obigen Beispiels fuhrt genau zu diesem Fall A B C IF A 5 THEN D E F Hier sind die beiden Berechnungen weiter voneinander unabhangig aber die zweite Befehlsfolge benotigt das Ergebnis der ersten Berechnung um zu wissen ob sie uberhaupt ausgefuhrt werden soll In diesen Fallen versucht eine CPU die dynamisches Scheduling einsetzt unter Verwendung verschiedener Methoden das wahrscheinliche Ergebnis der Bedingung vorherzusagen Moderne CPUs erreichen dabei Trefferquoten von etwa 90 In den restlichen 10 der Falle muss nicht nur auf das Ergebnis der ersten Berechnung gewartet werden sondern auch die gesamte bereits vorsortierte Pipeline geloscht und neu aufgebaut werden Dies fuhrt dazu dass etwa 20 der theoretischen Maximalrechenleistung des Prozessors verlorengehen Der Itanium geht das Problem ganz anders an er verwendet statisches Scheduling verlasst sich fur die Sprungvorhersage also auf den Compiler Dieser hat zwar einen vollstandigeren Uberblick uber das Programm jedoch nicht uber die konkreten Laufzeitbedingungen d h Use cases und Parametrisierung die erst zur Laufzeit feststehen Diese dem Compiler unbekannten Laufzeitinformation konnen jedoch uber die Profile Guided Optimization Technik uber definierte Testlaufe vorgegeben werden Ergebnisse sind z B welche Sprunge wie oft ausgefuhrt werden die GCC bietet dazu beispielsweise die Funktionen fprofile arcs und fbranch probabilities und welche Funktionen Hot Spots sind Diese Informationen kann der Compiler verwenden um bereits bei der Ubersetzung des Programmcodes die Entscheidungen zu treffen die sonst auf dem Chip zur Laufzeit getroffen werden mussten Sobald dem Compiler bekannt ist welche Pfade genommen werden bundelt er parallel ausfuhrbare Instruktionen zu einer grosseren Instruktion Diese lange Instruktion wird in das ubersetzte Programm geschrieben Daher der Name VLIW Very Long Instruction Word sehr langes Befehlswort Das Problem der effektiven Parallelisierung auf den Compiler zu verlagern hat mehrere Vorteile Zunachst einmal kann der Compiler wesentlich mehr Zeit damit verbringen den Code zu untersuchen Diesen Vorteil hat der Chip nicht da er so schnell wie moglich arbeiten muss Zweitens ist die Vorhersagelogik recht komplex und durch den neuen Ansatz lasst sich diese Komplexitat enorm reduzieren Der Prozessor muss den Code nicht mehr untersuchen sondern lost die VLIW Instruktionen nur noch in kleinere Einheiten auf die er an seine Funktionseinheiten weitergibt Der Compiler kann daher so viel Parallelitat wie moglich aus dem Programm holen und der Prozessor kann dann entsprechend seiner Fahigkeiten der Anzahl der parallelen Funktionseinheiten das Beste daraus machen Nachteil der Parallelisierung durch den Compiler ist die Tatsache dass das Laufzeitverhalten eines Programms nicht notwendigerweise aus seinem Quellcode hervorgeht Dies bedeutet dass auch der Compiler falsch entscheiden kann theoretisch auch haufiger als eine ahnliche Logik auf der CPU Die CPU hat z B noch den Vorteil dass sie sich in gewissen Grenzen merken kann welcher Sprung wie oft genommen wurde was der Compiler ohne Testlaufe nicht kann Das Itanium Design verlasst sich also stark auf die Leistung des Compilers 1 Es wird Hardwarekomplexitat auf dem Mikroprozessor gegen Softwarekomplexitat beim Compiler getauscht Programme konnen wahrend der Ausfuhrung von einem sogenannten Profiler untersucht werden welcher Daten uber das Laufzeitverhalten der Anwendung sammelt Diese Informationen konnen ebenfalls in den Kompiliervorgang Feedback Directed Compilation oder Profile Guided Optimization einfliessen um so eine bessere Optimierung zu erreichen Diese Technik ist nicht neu und wurde schon bei anderen Prozessoren verwendet Die Schwierigkeit liegt darin reprasentative Daten zu verwenden Bei synthetischen Benchmarks die regelmassig die gleichen Daten verwenden ist die Profiler gestutzte Optimierung leicht und gewinnbringend anzuwenden Implementierung BearbeitenDie Entwicklung der Itanium Serie begann 1994 und basierte auf Grundlagenforschung seitens der Firma Hewlett Packard bezuglich der VLIW Technik Ergebnis war ein von Grund auf neu entwickelter VLIW Prozessor ohne Kompromisse der sich jedoch nicht fur den Arbeitseinsatz eignete und auch nicht dafur vorgesehen war Nachdem Intel begonnen hatte sich an der Entwicklung zu beteiligen wurden diesem sauberen Prozessor verschiedene Funktionen hinzugefugt die fur die Vermarktung notwendig waren insbesondere die Fahigkeit zur Ausfuhrung von IA 32 x86 Instruktionen HP steuerte Fahigkeiten zur Erleichterung der Migration von seiner Hausarchitektur HP PA bei Ursprunglich sollte der Itanium bereits 1997 erscheinen seitdem hatte sich der Zeitplan jedoch mehrfach verschoben bis im Jahr 2001 die erste Version mit dem Codenamen Merced ausgeliefert wurde Angeboten wurden Geschwindigkeiten von 733 und 800 MHz sowie Cache Grossen von 2 oder 4 MiB die Preise lagen dabei zwischen 1 200 und ca 4 000 US Dollar Die Leistung des neuen Prozessors war aber enttauschend Im IA 64 Modus war er nur unwesentlich schneller als ein gleich getakteter x86 Prozessor und wenn er x86 Code ausfuhren musste brach die Leistung wegen der verwendeten Emulation auf etwa ein Achtel der Leistung eines vergleichbaren x86 Prozessors ein Intel behauptete dann die ersten Itanium Versionen seien keine wirkliche Veroffentlichung gewesen Das grosste aber nicht einzige Problem des Itanium ist die hohe Latenzzeit seines L3 Caches wodurch die tatsachlich nutzbare Cache Bandbreite stark vermindert wird Intel war gezwungen fur den nachsten Anlauf den L3 Cache auf dem Die zu integrieren Gleichzeitig wurden die Latenzen des primaren und sekundaren Caches bis unter die Werte des Power4 Prozessors von IBM gesenkt der damals die niedrigsten Latenzzeiten erreichte Ausserdem wurde der Front Side Bus des Itanium von 266 MHz bei 64 Bit auf 400 MHz bei 128 Bit erweitert so dass sich die Systembandbreite verdreifachte Diese Probleme wurden mit dem Nachfolger behoben oder zumindest abgemildert Probleme BearbeitenSchon kurz nach der offiziellen Vorstellung des Namens am 4 Oktober 1999 2 wurde der Spitzname Itanic 3 gepragt der den Namen der Titanic aufgriff und somit den neuen Prozessor mit dem als unsinkbar geltenden Schnelldampfer verglich der auf seiner Jungfernfahrt mit einem Eisberg kollidierte und sank Der Intel Itanium hatte von Anfang an mit zwei grossen Problemen zu kampfen Das erste war hausgemacht das zweite war etwas uberraschender Das erste war die Folge einer schweren und absehbaren Fehlentscheidung im Hause Intel keine Hardware Unterstutzung fur die Ausfuhrung von x86 32 Code zu bieten und x86 32 Code wenn auch mit gewisser Hardware Unterstutzung durch geeignete Befehle zu emulieren Legacy Drop Man hoffte vergebens darauf dass alle wichtigen Programme schnell auf die Itanium Plattform portiert werden was aber nur sehr zogerlich passierte oder gar ganz ausblieb Software die zum grossen Teil noch als x86 32 Code vorlag lief auf Itanium Rechnern sehr langsam Die Emulation erreichte die Geschwindigkeit eines Pentium 100 zu Zeiten als es den AMD Athlon XP mit 1600 MHz Pentium III Tualatin mit 1400 MHz und Pentium 4 Willamette mit 2000 MHz gab zu einem Bruchteil des Preises Obwohl es verschiedene Bemuhungen gab die Ausfuhrungsgeschwindigkeit von x86 Code zu steigern blieb der Itanium fur diesen Zweck allgemein zu langsam Die Relevanz dieser Fahigkeit ist zwar umstritten da die meisten Kunden keine Itanium Systeme kaufen um darauf x86 Code auszufuhren Auf der anderen Seite waren dadurch Itanium Systeme wirklich nur bei Vorliegen von geeigneter Software fur Server und nicht als allgemeine PC Workstations zu gebrauchen Intel plante die Emulationseinheit fur x86 Code durch einen JIT Compiler inspiriert von Digitals FX 32 fur den Alpha Prozessor zu ersetzen Man erhoffte sich davon schnellere Ausfuhrung und verringerte Chip Komplexitat Aber eigentlich war der Boden fur den Itanium ziemlich schnell verbrannt Das zweite Problem waren die Fortschritte in der CPU Entwicklung Ende der 1990er und Anfang der 2000er Jahre teilweise angeheizt durch das Wettrennen zwischen Intel und AMD teilweise auf Grund technologischer Fortschritte dieser Zeit Die klassischen CPUs hatten in der Zeit der Konzeptphase und erster Implementierungen des Itaniums sowohl im Bereich Taktfrequenz Faktor 20 wie auch im Bereich Effizienz Faktor 2 bis 5 innerhalb weniger Jahre so viel zugelegt so dass das Zielgebiet des Itaniums schon nahezu erreicht war als dieser dort nach einigen Verzogerungen einschlug Insbesondere kam es zu einer Entkopplung zwischen Befehlssatz einer CPU und der Ausfuhrung von Code die das Grundkonzept des Itaniums ad absurdum fuhrte Es war im Endeffekt sogar so dass sich die klassischen CPUs selbst besser an die gegebene Software anpassen konnten siehe Out of order execution Registerumbenennung SIMD Speculative execution Sprungvorhersage und Prefetching als der Itanium mit seiner starren Optimierung wahrend der Ubersetzungszeit in der man alles uber das Zielsystem wissen musste inklusive der Zugriffszeiten auf den Hauptspeicher Durch die Verlagerung von Hardwarekomplexitat in den Compiler tritt wie schon eben angedeutet das Problem auf dass fur eine optimale Performance der Software diese auf jedem Zielsystem mit einem fur dieses Zielsystem optimierten Compiler jeweils profiliert und kompiliert werden musste was bei Closed Source Software unmoglich und bei Open Source Software aufwendig ist Bis komplexe Anwendungssoftware auf neue Compiler umgestellt erfolgreich getestet ausgeliefert und schlussendlich beim Anwender eingesetzt wird konnen weitere Monate oder Jahre vergehen Bei Prozessoren im superskalaren Design profitieren Anwender in der Regel unmittelbar von Verbesserungen Davon unbenommen sind in beiden Fallen Verbesserungen durch neue Prozessorbefehle die erst durch eine Anderung der Software verwendet werden konnen nbsp Verkaufsprognosen Die 2000 anvisierten Verkaufs zahlen wurden uber 6 Jahre nach unten korrigiert und wurden nie auch nur ansatzweise erreicht Der Itanium konzipiert als neue Hochleistungs CPU war schon bei Ankunft ein nahezu totes Pferd Intel hat allerdings uber zehn Jahre gebraucht sich das einzugestehen Die Entwicklung wurde halbherzig uber 10 Jahre bis 2012 fortgefuhrt Der Hauptaufwand der Entwicklung wurde in den damals boomenden Markt der x86 64 CPUs gesteckt wo auch das meiste Geld hereinkam Eine Beschleunigung dieses Prozesses hatte moglicherweise erreicht werden konnen indem der Hersteller entsprechende optimierende Compiler mit dem speziellen Wissen um die eigene Architektur frei und zeitnah angeboten hatte Insbesondere Programme mit Quelltext die auf Kundensystemen ubersetzt werden hatten davon profitiert Aufgrund der Itanium Entwicklungen sollten HPs Alpha Prozessor und die PA RISC Architektur auslaufen Unterstutzung dieser Plattformen sollte ab 2007 fur noch etwa funf Jahre gewahrleistet sein SGI hat seine MIPS basierten Workstations inzwischen zugunsten des Itaniums eingestellt Die Oracle Corporation kundigte im Marz 2011 an dass sie Itanium Chips nicht mehr unterstutzen werde 4 Von diesem Schritt war auch HP uberrascht 5 HP verklagte deswegen Oracle da HP der Auffassung war es bestunden Vertrage mit Oracle in denen eine langfristige Unterstutzung der Itanium Plattform geregelt sei 6 Im Streit setzte sich HP vor Gericht durch Demnach muss Oracle weiterhin Software fur Itanium anbieten 7 Modelldaten BearbeitenMerced Bearbeiten Revision C0 C1 und C2 8 L1 Cache 16 16 KiB Daten Instruktionen L2 Cache 96 KiB on die L3 Cache 2 und 4 MiB mit Prozessortakt IA 64 IA 32 Emulation MMX SSE PAC418 64 Bit Bus mit 133 MHz DDR FSB266 Betriebsspannung VCore Leistungsaufnahme TDP 114 W 2 MiB L3 Cache und 130 W 4 MiB L3 Cache Erstes Erscheinungsdatum Juni 2001 Fertigungstechnik 180 nm Die Grosse 300 mm bei 325 Millionen Transistoren davon 300 Millionen fur den L3 Cache Taktraten 733 MHz mit 2 oder 4 MiB L3 Cache 800 MHz mit 2 oder 4 MiB L3 CacheNachfolger BearbeitenDem Itanium Merced folgte rasch der Itanium 2 Siehe Intel Itanium 2 Jahr Typ Taktfreq Kerne L1 L2 L32001 Itanium Merced 0 73 0 80 GHz 1 16 16 K 0 96 K 0 2 4 M2002 05 Itanium 2 McKinley and Madison 0 90 1 67 GHz 1 256 K 0 1 9 M2006 07 Itanium 2 9000 and 9100 1 40 1 67 GHz 2 256 1024 K 0 6 24 M2010 Itanium 9300 Tukwila 1 33 1 73 GHz 2 4 256 512 K 10 24 M2012 Itanium 9500 Poulson 1 73 2 53 GHz 4 8 256 512 K 20 32 M2017 Itanium 9700 Kittson 1 73 2 66 GHzSiehe auch BearbeitenItanium Architektur Liste der Mikroprozessoren von Intel Extensible Firmware InterfaceWeblinks Bearbeiten nbsp Commons Itanium 1 Sammlung von Bildern Videos und Audiodateien cpu collection de Bilder eines zerlegten Itanium Moduls auf cpu collection deEinzelnachweise Bearbeiten Andy Patrizio Why Intel can t seem to retire the x86 ITworld 4 Marz 2013 archiviert vom Original am 16 Mai 2013 abgerufen am 15 April 2013 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www itworld com Michael Kanellos Intel names Merced chip Itanium In CNET News com 4 Oktober 1999 abgerufen am 30 April 2007 Kraig Finstad Re Itanium In USENET group comp sys mac advocacy 4 Oktober 1999 abgerufen am 24 Marz 2007 Oracle Stops All Software Development For Intel Itanium Microprocessor vom 22 Marz 2011 engl HP Supports Customers Despite Oracle s Anti customer Actions HP News release vom 23 Marz 2011 engl Yasmin El Sharif Prozessorstreit Hewlett Packard verklagt Oracle In Spiegel Online 16 Juni 2011 abgerufen am 26 Juli 2015 Jens Ihlenfeld Itanium Prozessor HP gewinnt gegen Oracle In Golem 1 August 2012 abgerufen am 26 Juli 2015 Adrian Offerman The Processor Portal Intel Itanium processor Merced In The Chiplist Abgerufen am 12 Februar 2017 englisch nbsp Intel ProzessorenListe aller Prozessoren ab 1970 alle Modellnummern von 2004 bis 2009 Vor x86 Prozessoren Desktop 4004 4040 8008 8080 8085iAPX 86 bis zur 4 Generation Desktop 8086 8088 80186 80188 80286 80386 i386 80486 i486 Overdrive VersionenPentium Serie Desktop Pentium MMX Pentium II Pentium III Pentium 4 Pentium 4 XE Pentium D Pentium XE Pentium Dual Core Overdrive VersionenMobil Mobile Pentium 4 Pentium M Pentium Dual CoreServer Pentium ProCeleron Serie Desktop Celeron P6 Celeron NetBurst Celeron D Celeron Core Celeron Dual CoreMobil Mobile Celeron Celeron MCore Serie Desktop Core Core Solo Core Duo Core 2 Core i Core MXeon Serie ii Server Xeon P6 Xeon NetBurst Xeon Core Xeon Nehalem Xeon Sandy Bridge Xeon Ivy Bridge Xeon Haswell Xeon Broadwell Xeon Skylake Xeon Kaby Lake Xeon Coffee Lake Xeon Cascade Lake Xeon Ice Lake Xeon Sapphire Rapids Atom Serie Desktop Atomx86 kompatible SoCs Desktop Quark EdisonNicht x86 Prozessoren Desktop iAPX 432 i860 i960 Itanium Itanium 2 XScaleWeitere Listen Celeron Pentium Core 2 Core i Intel Mikroarchitekturen x86 Mikroarchitekturen 8086 80186 80286 80386 80486 P5 P6 NetBurst Core Solo Core Duo Core 2 Nehalem Westmere Sandy Ivy Bridge Haswell Broadwell Skylake Kaby Lake Coffee Lake Whiskey Lake Cannon Lake Cascade Lake Ice Lake Comet Lake Tiger Lake Rocket Lake Alder Lake Raptor Lake Meteor Lake AtomNon x86 Mikroarchitekturen Mikrocontroller MCS 48 MCS 51 MCS 96 XScale Server Itanium Itanium 2GPU Mikroarchitekturen Larrabee Intel HD Graphics Alchemist Abgerufen von https de wikipedia org w index php title Intel Itanium amp oldid 233088582