www.wikidata.de-de.nina.az
Gleitkommaoperationen pro Sekunde kurz FLOPS englisch fur Floating Point Operations Per Second ist ein Mass fur die Leistungsfahigkeit von Computern 1 oder Prozessoren und bezeichnet die Anzahl der Gleitkommazahl Operationen Additionen oder Multiplikationen die von ihnen pro Sekunde ausgefuhrt werden konnen Einheiten der Gleitkommarechenleistung mit SI Vorsatzen kFLOPS KiloFLOPS 103 FLOPSMFLOPS MegaFLOPS 106 FLOPSGFLOPS GigaFLOPS 109 FLOPSTFLOPS TeraFLOPS 1012 FLOPSPFLOPS PetaFLOPS 1015 FLOPSEFLOPS ExaFLOPS 1018 FLOPSZFLOPS ZettaFLOPS 1021 FLOPSYFLOPS YottaFLOPS 1024 FLOPSHaufig wird als FLOP eine Gleitkommazahlen Operation englisch floating point operation bezeichnet wodurch vereinzelt auch die Variante FLOP s auftaucht beide Varianten sind allerdings gleichbedeutend Inhaltsverzeichnis 1 Beschreibung 2 Berechnung 3 Rechenleistung von Computersystemen 4 Siehe auch 5 EinzelnachweiseBeschreibung BearbeitenDie Anzahl der Gleitkommaoperationen ist nicht unbedingt direkt zur Taktgeschwindigkeit des Prozessors proportional da je nach Implementierung Gleitkommaoperationen unterschiedlich viele Taktzyklen benotigen Vektorprozessoren fuhren in jedem Takt bis zu einige tausend Operationen aus So erreichen Grafikkarten die als Vektorprozessoren arbeiten im Jahr 2020 Rechenleistungen in einfacher Genauigkeit SP 32 Bit Float von 30 TeraFLOPS 2 was auch die Motivation fur das Auslagern von Gleitkommazahlen Operation auf den Grafikprozessor GPGPU ist Die Rechenleistung von Supercomputern hangt nicht nur von der Zahl und der Leistung der verwendeten Prozessoren ab sondern auch von der Art und Geschwindigkeit der Vernetzung der Rechenknoten Die verwendete Software wie die verwendete Sprache und Compiler spielen ebenso eine grosse Rolle Meist wird ebenso wie bei der Einheit IPS eine Best Case Abschatzung oder gar ein nur theoretisch moglicher Wert angegeben Berechnung BearbeitenDie theoretische Spitzenleistung Theoretical Peak Performance eines einzelnen Rechenknotens lasst sich durch Multiplikation folgender Werte berechnen Taktfrequenz Anzahl der CPU Sockel CPU Kerne pro Sockel min Befehle die pro Takt angefangen werden konnen Anzahl der Rechenwerke Latenz eines Befehles Datenworte pro Rechenregister numerische Operationen pro BefehlFur 2 5 GHz 2 Sockel 24 Kerne 2 angefangene Befehle pro Takt 8 Datenworte pro Rechenregister 256 bit Register bei single oder 512 bit Register bei double precision 2 numerische Operationen pro Befehl FMA erhalt man 3 84 TFLOPS Rechenleistung von Computersystemen BearbeitenDie FLOPS eines Computers werden durch definierte Programmpakete Benchmarks etwa LINPACK oder Livermore Benchmark bestimmt In der Rangliste TOP500 werden die 500 schnellsten Computersysteme gemessen an ihren FLOPS mit dem LINPACK Benchmark aufgefuhrt Es bestehen Computersysteme mit vergleichbaren Leistungen die am Ranking nicht teilnehmen so dass diese Liste nicht vollstandig ist Der erste in der Praxis einsetzbare frei programmierbare Rechner die elektromechanische Zuse Z3 aus dem Jahre 1941 schaffte knapp 2 Additionen pro Sekunde und damit 2 FLOPS Andere Operationen dauerten jedoch teilweise wesentlich langer Der Intel 8087 Coprozessor mit einem 8088 als Hauptprozessor von 1980 schaffte 50 kFLOPS 3 Anfang des 21 Jahrhunderts erreichte ein PC mit einem Pentium 4 Prozessor bei einer Taktfrequenz von 3 GHz nach Angaben von IBM etwa 6 GFLOPS Eine konventionelle Grafikkarte leistet im Jahr 2020 bis zu 36 TFLOPS Das Verhaltnis von Rechenleistung zum Bedarf an elektrischer Leistung wird besser wobei die gesamte Energiezufuhr eher ansteigt So benotigte der in der TOP500 Liste 11 2005 fuhrende BlueGene L von IBM fur seine Leistung von rund 280 TFLOPS nur 70 m Flache und 1 77 MW elektrische Leistung was im Vergleich zum drei Jahre alteren Earth Simulator 35 86 TFLOPS mit 3000 m und 6 MW eine deutliche Verbesserung darstellt Die elektrische Leistung ist ein Hauptgrund warum altere Systeme nicht langer als Supercomputer weiterbetrieben werden und ungefahr alle funf Jahre eine neuere Rechnergeneration installiert wird Ein anderes Beispiel Der im Juli 2005 schnellste Computer Deutschlands ein 57 Millionen Euro teurer NEC mit 576 Hauptprozessoren am Hochstleistungsrechenzentrum Stuttgart HLRS brachte es auf bis zu 12 7 TFLOPS und wurde optimistisch als 5000 mal schneller als ein normaler PC bezeichnet 4 Die Betriebskosten ohne Anschaffung bezifferte der Betreiber auf 1 3 Millionen Euro im Jahr sowie 1 5 Millionen Euro Personalkosten 5 Wegen der hohen Anschaffungskosten wurde eine derartig leistungsfahige Anlage zu einem Stundensatz von ca 4000 Euro fur das Gesamtsystem vermietet Angehorige der Universitat Stuttgart zahlten jedoch einen deutlich niedrigeren Preis 6 Bereits im Marz 2006 wurde der neueste schnellste Computer Deutschlands in Julich in Betrieb genommen der JUBL Julicher Blue Gene L Mit 45 6 TFLOPS bot er zu diesem Zeitpunkt als sechstschnellster Computer der Welt die Rechenleistung von 15 000 normalen zeitgemassen PCs Interessant ist fur die weitere Entwicklung die Einschatzung der Rechenzeit Bedarfsentwicklung durch den Vorstandsvorsitzenden des Julicher Forschungszentrums Marz 2006 Die Nachfrage nach Rechenzeit wird in den nachsten funf Jahren noch um den Faktor 1000 steigen Die etwa 700 000 aktiven Computer der Berkeley Open Infrastructure for Network Computing brachten es im Dezember 2015 auf eine Durchschnittsleistung von etwa 12 PetaFLOPS 7 Der Korrelator des Atacama Large Millimeter submillimeter Array ALMA fuhrte im Dezember 2012 17 PetaFLOPS aus 8 9 wahrend die Rechenleistung des WIDAR Korrelator am Expanded Very Large Array EVLA mit 40 PetaFLOPS angegeben ist 10 11 Derzeit sind verschiedene Supercomputerbetreiber bestrebt in den Leistungsbereich von Exaflops vorzustossen Die Anhaufung von immer mehr Prozessoren gerat immer mehr an die Grenze des physikalisch Machbaren Mit zunehmender Anzahl der Kerne steigt die Wahrscheinlichkeit von Ausfallen oder Fehlfunktion einzelner Komponenten Mit der Zahl der Prozessorkerne wachsen nicht nur die Rechenleistung sondern auch Strombedarf und Abwarme die Anforderungen an den Datenaustausch die Datennetze sowie die Datenspeicherung und Archivierung Neuere Systeme sind zunehmend darauf konzipiert aus der anfallenden Abwarme zusatzlichen Nutzen zu generieren So werden damit z B Gebaude oder Gewachshauser beheizt Teilweise wird uberlegt ob Supercomputer mit eigenen Kraftwerken ausgestattet werden sollen Beispiele der GFLOPS Werte an einigen Prozessoren 12 LINPACK 1kx1k DP Spitzenleistung GFLOPS Durchschnittsleistung GFLOPS EffizienzCell 1 SPU 3 2 GHz 1 83 1 45 79 Cell 8 SPUs 3 2 GHz 14 63 9 46 65 Pentium 4 3 2 GHz 6 4 3 1 48 Pentium 4 SSE3 3 6 GHz 14 4 7 2 50 Core i7 3 2 GHz 4 Kerne 51 2 33 0 HT enabled 13 64 Intel Core i7 3 47 GHz 6 Kerne 83 2Intel Core i7 2600k Sandy Bridge 3 4 GHz 4K 8T 102 5 92 3 90 Itanium 1 6 GHz 6 4 5 95 93 Nvidia GeForce RTX 4090 82580Nvidia Tesla GP100 1 48 GHz 10600Nvidia Quadro P6000 19553 12901Intel Xeon Skylake SP 6148 1536AMD Ryzen 1800X 8K 16T bislang unoptimiert 221 14 Intel Core i7 7700K Kaby Lake 4K 8T 241 14 Intel Core i7 5960X Haswell E 8K 16T 375 14 Intel Core i7 5820k 6K 12T 3 3 GHz 273 1 265Siehe auch BearbeitenWhetstone Programm Standard Performance Evaluation CorporationEinzelnachweise Bearbeiten Floating Point Operations per Second Flops In Glossareintrag bei heise online Stand 8 November 2010 Nvidia GeForce RTX 3080 angetestet Her mit Ampere In heise de abgerufen am 18 September 2020 Coprocessor info x87 info you need to know 30 September 2011 archiviert vom Original am 30 September 2011 abgerufen am 14 August 2019 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot coprocessor cpu info com Hochstleistungsrechenzentrum Universitat Stuttgart Systeme In Schwaben wird extrem schnell gerechnet In Stern de 22 Juli 2005 abgerufen am 17 Januar 2014 Entgeltordnung fur die Nutzung der Rechenanlagen des Hochstleistungsrechenzentrums Stuttgart HLRS Memento vom 23 Oktober 2013 im Internet Archive PDF 105 kB Berkeley Open Infrastructure for Network Computing In boinc berkeley edu Powerful Supercomputer Makes ALMA a Telescope Hochstgelegener Supercomputer der Welt gleicht Astronomiedaten ab In Heise online National Radio Astronomy Observatory Cross Correlators amp New Correlators Implementation amp choice of architecture S 27 PDF 9 4 MB National Radio Astronomy Observatory The Expanded Very Large Array Project The WIDAR Correlator S 10 PDF 13 2 MB IBM Cell Broadband Engine Architecture and its first implementation Test Intel Core i7 mit Nehalem Quad Core a b c Anon Ryzen 1800X linpack results In https i imgur com RDvvhN0 png reddit com 27 Februar 2017 abgerufen am 27 Dezember 2017 englisch Normdaten Sachbegriff GND 7749349 7 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Floating Point Operations Per Second amp oldid 237222402