www.wikidata.de-de.nina.az
Das Verfahren der Lagrange Multiplikatoren nach Joseph Louis Lagrange ist in der mathematischen Optimierung eine Methode zur Losung von Optimierungsproblemen mit Nebenbedingungen Ein Optimierungsproblem mit Nebenbedingungen ist die Aufgabe ein lokales Extremum einer Funktion in mehreren Veranderlichen mit einer oder mehreren Nebenbedingungen zu finden wobei die Nebenbedingungen als Nullstellen von Funktionen definiert sind Diese Methode fuhrt eine neue unbekannte skalare Variable fur jede Nebenbedingung ein einen Lagrange Multiplikator und definiert eine Linearkombination die die Multiplikatoren als Koeffizienten einbindet Die Losungen der ursprunglichen Optimierungsaufgabe konnen dann unter gewissen Voraussetzungen als kritische Punkte dieser sogenannten Lagrange Funktion bestimmt werden Visualisierung der Methode der Lagrange Multiplikatoren Die rote Linie stellt die Menge dar auf der g x y c displaystyle g x y c erfullt ist Die blauen Linien sind Hohenlinien f x y d displaystyle f x y d fur verschiedene Werte von d displaystyle d An dem Punkt an dem f displaystyle f unter der Nebenbedingung g c displaystyle g c maximal ist verlauft g c displaystyle g c tangential zur Hohenlinie f x y d 1 displaystyle f x y d 1 Dort sind die Gradienten der Funktionen f displaystyle f und g displaystyle g dargestellt durch blaue bzw rote Pfeile kollinear Dasselbe Problem wie oben wobei die Funktionswerte von f displaystyle f auf der Hohenachse abgetragen sind rot sind die Funktionswerte von f displaystyle f an Punkten x y displaystyle x y fur die gilt g x y c displaystyle g x y c Inhaltsverzeichnis 1 Beschreibung 2 Beispiele 2 1 Beispiel mit Nebenbedingung ohne verschwindenden Gradienten 2 2 Beispiel mit Anwendungsbezug 2 3 Beispiel mit Nebenbedingung mit verschwindendem Gradienten 3 Mehrere Nebenbedingungen 4 Hinreichende Bedingungen 5 Bedeutung der Lagrange Multiplikatoren in der Physik 6 Verallgemeinerungen 7 Literatur 8 WeblinksBeschreibung BearbeitenZunachst betrachten wir den zweidimensionalen Fall mit einer Nebenbedingung Nehmen wir an wir wollen eine Funktion f x y displaystyle f x y nbsp maximieren wobei die Nebenbedingung g x y 0 displaystyle g x y 0 nbsp einzuhalten ist manche Quellen verwenden stattdessen g x y c displaystyle g x y c nbsp mit einer Konstante c displaystyle c nbsp Die Nebenbedingung filtert bestimmte Punkte der x displaystyle x nbsp y displaystyle y nbsp Ebene heraus die zusammengenommen Kurven bilden Fur unsere Betrachtung nehmen wir an die Nebenbedingung sei so geartet dass sie durch eine einzelne Kurve dargestellt werden kann siehe nebenstehendes Bild rote Kurve Wenn wir uns auf dieser Kurve bewegen beruhren oder schneiden wir Hohenlinien von f x y displaystyle f x y nbsp Wir sehen nun dass wir immer nur dann ein Maximum d displaystyle d nbsp der Funktion f x y displaystyle f x y nbsp erreichen wenn unsere Bewegung auf der Kurve g x y 0 displaystyle g x y 0 nbsp tangential zur Hohenlinie f x y d displaystyle f x y d nbsp verlauft Andernfalls konnen wir durch Vorwarts oder Ruckwartsbewegung auf der Kurve g x y 0 displaystyle g x y 0 nbsp den Funktionswert von f x y displaystyle f x y nbsp noch weiter vergrossern ohne die Nebenbedingung zu verletzen Ein bekanntes Beispiel kann den Wetterkarten mit ihren Hohenlinien fur Temperaturen und Druck entnommen werden Die Extrema unter der Nebenbedingung treten dort auf wo sich beim Uberlagern der Karten Linien beruhren Geometrisch ubersetzen wir die Tangentenbedingung indem wir sagen dass die Gradienten von f displaystyle f nbsp und g displaystyle g nbsp beim Maximum parallele Vektoren sind wobei der Gradient von g displaystyle g nbsp nicht verschwinden darf Wir suchen also Punkte x y displaystyle x y nbsp mit g x y 0 displaystyle g x y 0 nbsp an denen x y g 0 displaystyle nabla x y g neq 0 nbsp und x y f l x y g displaystyle nabla x y f lambda nabla x y g nbsp Dabei wurden die folgenden Abkurzungen bzw Definitionen fur die zugehorigen Gradienten benutzt x y f f x f y displaystyle nabla x y f left frac partial f partial x frac partial f partial y right nbsp und x y g g x g y displaystyle nabla x y g left frac partial g partial x frac partial g partial y right nbsp Der konstante Lagrange Multiplikator l displaystyle lambda nbsp wird dabei benotigt weil die beiden Gradienten zwar parallel sein sollen aber als Vektoren unterschiedlich lang sein konnen Um alle genannten Bedingungen zu einer Gleichung zusammenzufassen ist es nutzlich die folgende Lagrange Funktion zu verwenden L x y l f x y l g x y displaystyle Lambda x y lambda f x y lambda cdot g x y nbsp Die Losung des oben beschriebenen Optimierungsproblems mit einer Nebenbedingung entspricht jetzt einem kritischen Punkt der Lagrange Funktion d h x y l L x y l 0 displaystyle nabla x y lambda Lambda x y lambda 0 nbsp Die x displaystyle x nbsp und die y displaystyle y nbsp Komponente dieser Gleichung entsprechen dabei der Forderung nach Parallelitat der zwei ursprunglichen Gradienten die dritte Komponente l L x y l 0 displaystyle nabla lambda Lambda x y lambda 0 nbsp ist identisch mit g x y 0 displaystyle g x y 0 nbsp Punkte bei denen der Gradient der Nebenbedingung g displaystyle g nbsp verschwindet mussen gesondert betrachtet werden weil das Verfahren der Lagrange Multiplikatoren uber sie keine Aussage treffen kann Da im Allgemeinen nicht jeder kritische Punkt der Lagrange Funktion das ursprungliche Optimierungsproblem lost liefert dieses Verfahren nur eine notwendige Bedingung fur die Losung des Optimierungsproblems Beispiele Bearbeiten nbsp Darstellung eines Optimierungsproblems mit einer NebenbedingungBeispiel mit Nebenbedingung ohne verschwindenden Gradienten Bearbeiten In diesem Beispiel soll die Funktion f x y x y displaystyle f x y x y nbsp unter der Nebenbedingung x 2 y 2 1 displaystyle x 2 y 2 1 nbsp optimiert werden Die Nebenbedingung entspricht also dem Einheitskreis Mit Hilfe der Grafik kann das Maximum bei 2 2 2 2 displaystyle sqrt 2 2 sqrt 2 2 nbsp bestimmt werden Das Minimum des Optimierungsproblems liegt bei 2 2 2 2 displaystyle sqrt 2 2 sqrt 2 2 nbsp Zunachst uberprufen wir an welchen Punkten des Einheitskreises der Gradient der Nebenbedingungsfunktion g x y x 2 y 2 1 displaystyle g x y x 2 y 2 1 nbsp verschwindet Wir berechnen also x y g 2 x 2 y displaystyle nabla x y g 2x 2y nbsp und sehen dass dies nur im Ursprung gleich 0 0 displaystyle 0 0 nbsp ist Jedoch liegt dieser Punkt nicht auf dem Einheitskreis erfullt also nicht die Nebenbedingung und wird somit nicht in die Liste der kritischen Punkte aufgenommen Um die Methode der Lagrange Multiplikatoren anwenden zu konnen sei L x y l f x y l g x y x y l x 2 l y 2 l displaystyle Lambda x y lambda f x y lambda g x y x y lambda x 2 lambda y 2 lambda nbsp Die Bedingung d L 0 displaystyle d Lambda 0 nbsp ergibt die folgenden drei Gleichungen L x 1 2 l x 0 i L y 1 2 l y 0 ii L l x 2 y 2 1 0 iii displaystyle begin aligned frac partial Lambda partial x amp 1 2 lambda x amp amp 0 qquad text i frac partial Lambda partial y amp 1 2 lambda y amp amp 0 qquad text ii frac partial Lambda partial lambda amp x 2 y 2 1 amp amp 0 qquad text iii end aligned nbsp Die dritte Gleichung iii entspricht dabei wie immer der geforderten Nebenbedingung Mit l 0 displaystyle lambda neq 0 nbsp kann i nach x displaystyle x nbsp aufgelost werden Dasselbe macht man fur Gleichung ii und y displaystyle y nbsp Man erhalt somit x 1 2 l y displaystyle x 1 2 lambda y nbsp Wird das in iii eingesetzt erhalt man 2 l 2 1 displaystyle 2 lambda 2 1 nbsp also l 1 2 2 2 displaystyle lambda pm 1 sqrt 2 pm sqrt 2 2 nbsp Die kritischen Punkte berechnen sich damit zu 2 2 2 2 displaystyle sqrt 2 2 sqrt 2 2 nbsp und 2 2 2 2 displaystyle sqrt 2 2 sqrt 2 2 nbsp Die zu optimierende Funktion f displaystyle f nbsp hat an diesen zwei Punkten die Werte 2 displaystyle sqrt 2 nbsp bzw 2 displaystyle sqrt 2 nbsp Beispiel mit Anwendungsbezug Bearbeiten Ein Grundstuck soll die Form einer Ellipse mit Schwerpunkt im Ursprung und Haupt und Nebenachse parallel zur x displaystyle x nbsp und y displaystyle y nbsp Achse aufweisen Ausserdem soll das Grundstuck mit der Flache A p a b displaystyle A pi ab nbsp so klein wie moglich sein Die Ellipse soll durch einen gegebenen Punkt x y displaystyle x y nbsp gehen Diese Nebenbedingung liegt in Form der Gleichung x 2 a 2 y 2 b 2 1 displaystyle frac x 2 a 2 frac y 2 b 2 1 nbsp vor die eine Ellipse mit Zentrum im Ursprung Hauptachse der Lange 2 a displaystyle 2a nbsp und Nebenachse der Lange 2 b displaystyle 2b nbsp beschreibt Hauptachse und Nebenachse liegen parallel zur x displaystyle x nbsp und y displaystyle y nbsp Achse weshalb die Ellipse durch die Punkte a 0 displaystyle a 0 nbsp und 0 b displaystyle 0 b nbsp verlauft Die allgemeine Lagrange Funktion mit beliebigen Werten fur x displaystyle x nbsp und y displaystyle y nbsp lautet L a b l p a b l x 2 a 2 y 2 b 2 1 p a b x 2 l a 2 y 2 l b 2 l displaystyle Lambda a b lambda pi ab lambda left frac x 2 a 2 frac y 2 b 2 1 right pi ab x 2 frac lambda a 2 y 2 frac lambda b 2 lambda nbsp mit l 0 displaystyle lambda neq 0 nbsp Der Gradient hiervon wird auf Null gesetzt um die kritischen Punkte zu bestimmen Hierbei wird a gt x gt 0 displaystyle a gt x gt 0 nbsp und b gt y gt 0 displaystyle b gt y gt 0 nbsp vorausgesetzt Denn fur a 0 displaystyle a 0 nbsp oder b 0 displaystyle b 0 nbsp erhielte man eine leere Ellipse a L a b l p b 2 x 2 l a 3 0 p a 3 b 2 x 2 l 0 displaystyle frac partial partial a Lambda a b lambda pi b 2x 2 frac lambda a 3 0 Leftrightarrow pi a 3 b 2x 2 lambda 0 nbsp b L a b l p a 2 y 2 l b 3 0 p a b 3 2 y 2 l 0 displaystyle frac partial partial b Lambda a b lambda pi a 2y 2 frac lambda b 3 0 Leftrightarrow pi ab 3 2y 2 lambda 0 nbsp l L a b l x 2 a 2 y 2 b 2 1 0 x 2 b 2 y 2 a 2 a 2 b 2 displaystyle frac partial partial lambda Lambda a b lambda frac x 2 a 2 frac y 2 b 2 1 0 Leftrightarrow x 2 b 2 y 2 a 2 a 2 b 2 nbsp Die erste Gleichung wird zu l p a 3 b 2 x 2 displaystyle lambda frac pi a 3 b 2x 2 nbsp umgeformt und in die zweite Gleichung eingesetzt p a b 3 p y 2 a 3 b x 2 0 displaystyle pi ab 3 frac pi y 2 a 3 b x 2 0 nbsp ergibt x 2 b 2 y 2 a 2 displaystyle x 2 b 2 y 2 a 2 nbsp Setzt man diesen Ausdruck in die dritte Gleichung ein erhalt man durch Ruckeinsetzen die Losungen a 2 x b 2 y und l p a b 2 p x y 0 displaystyle a sqrt 2 x b sqrt 2 y text und lambda pi ab 2 pi xy neq 0 nbsp Der Gradient der Nebenbedingungsfunktion g a b 2 x 2 a 3 2 y 2 b 3 displaystyle nabla g a b left frac 2x 2 a 3 frac 2y 2 b 3 right nbsp verschwindet fur x y 0 displaystyle x y 0 nbsp Da der Punkt 0 0 displaystyle 0 0 nbsp nicht auf der Ellipse liegt handelt es sich bei a b 2 x 2 y displaystyle a b sqrt 2 x sqrt 2 y nbsp um das gesuchte Minimum Dies muss im Einzelfall grafisch uberpruft werden da die Lagrange Multiplikatoren nur ein notwendiges Kriterium liefern Beispiel mit Nebenbedingung mit verschwindendem Gradienten Bearbeiten Wir betrachten die Funktion f R 0 R 0 R displaystyle f colon mathbb R 0 times mathbb R 0 to mathbb R nbsp mit f x y e x y displaystyle f x y e x y nbsp Untersucht man die Funktion nun auf Extrema so kann man mithilfe des hinreichenden Kriteriums fur lokale Extremstellen alle Extrema im Inneren des Definitionsbereiches bestimmen Die Randextrema werden jedoch mithilfe des Lagrange Multiplikator gefunden Dabei bildet der Rand des Definitionsbereiches die Nebenbedingung Hier sind es die beiden positiven Koordinatenachsen und der Ursprung Wir finden also die Nebenbedingung g R 0 R 0 R displaystyle g colon mathbb R 0 times mathbb R 0 to mathbb R nbsp mit g x y x y 0 displaystyle g x y xy 0 nbsp Wir stellen zunachst die Lagrange Funktion auf L x y l f x y l g x y e x y l x y displaystyle Lambda x y lambda f x y lambda g x y e x y lambda xy nbsp Die Gleichung x y l L 0 displaystyle nabla x y lambda Lambda 0 nbsp fuhrt uns auf das Gleichungssystem L x e x y l y 0 i L y e x y l x 0 ii L l x y 0 iii displaystyle begin aligned frac partial Lambda partial x amp e x y lambda y amp amp 0 qquad text i frac partial Lambda partial y amp e x y lambda x amp amp 0 qquad text ii frac partial Lambda partial lambda amp xy amp amp 0 qquad text iii end aligned nbsp Die dritte Gleichung besagt dass x 0 displaystyle x 0 nbsp oder y 0 displaystyle y 0 nbsp Angenommen es ware x 0 displaystyle x 0 nbsp dann fuhrt dies in die zweite Gleichung eingesetzt auf einen Widerspruch denn die Gleichung e y 0 displaystyle e y 0 nbsp hat keine Losung da die e displaystyle e nbsp Funktion keine Nullstellen besitzt Analog fuhrt man den Fall y 0 displaystyle y 0 nbsp mit der ersten Gleichung auf einen Widerspruch Der Lagrange Multiplikator liefert also keine kritischen Punkte Jedoch haben wir nicht uberpruft an welchen Stellen der Gradient der Nebenbedingung verschwindet Es gilt x y g y x 0 0 x y 0 0 displaystyle nabla x y g y x 0 0 Leftrightarrow x y 0 0 nbsp Im Ursprung verschwindet also der Gradient der Nebenbedingung und dieser liegt auch auf dem Rand des Definitionsbereiches von f displaystyle f nbsp er erfullt die Nebenbedingung Wie oben beschrieben mussen diese Punkte auch als Kandidaten fur Extrema in Betracht gezogen werden Und in der Tat ist f 0 0 e 0 1 displaystyle f 0 0 e 0 1 nbsp und f x y e x y lt 1 displaystyle f x y e x y lt 1 nbsp fur alle x y 0 0 displaystyle x y neq 0 0 nbsp Der Ursprung ist also das globale Maximum der Funktion Das Vorhandensein von kritischen Punkten sagt jedoch nichts uber das Vorhandensein von Extrema aus Wurde man in diesem Beispiel die Definitionsbereiche von f displaystyle f nbsp und g displaystyle g nbsp durch R R displaystyle mathbb R times mathbb R nbsp ersetzen so wurde man zwar denselben einzigen kritischen Punkt erhalten jedoch ware der Ursprung kein globales und auch kein lokales Maximum von f displaystyle f nbsp z B divergiert die Funktion im 3 Quadranten In der Tat besasse dieses f displaystyle f nbsp keine lokalen Maxima oder Minima Mehrere Nebenbedingungen BearbeitenEs sei f displaystyle f nbsp eine in einer offenen Teilmenge U R n displaystyle U subseteq mathbb R n nbsp definierte Funktion Wir definieren s displaystyle s nbsp voneinander unabhangige Nebenbedingungen g k x 0 displaystyle g k x 0 nbsp k 1 s displaystyle k 1 ldots s nbsp D h die Gradienten der Nebenbedingungen sind fur jeden Punkt x U displaystyle x in U nbsp mit g k x 0 displaystyle g k x 0 nbsp fur alle k 1 s displaystyle k 1 ldots s nbsp linear unabhangig Insbesondere bedeutet dies dass keiner der Gradienten verschwindet Sollten die Gradienten doch an einer Stelle linear abhangig sein so wird dieser Punkt in die Liste der kritischen Punkte aufgenommen Nun setzen wir L x l f x k 1 s l k g k x displaystyle Lambda x lambda f x sum k 1 s lambda k g k x nbsp wobei x x 1 x n displaystyle x x 1 dots x n nbsp und l l 1 l s displaystyle lambda lambda 1 dots lambda s nbsp ist Wir schauen uns nun den kritischen Punkt von L displaystyle Lambda nbsp an L x i 0 displaystyle frac partial Lambda partial x i 0 nbsp was aquivalent ist zu f x i k 1 s l k g k x i displaystyle frac partial f partial x i sum k 1 s lambda k frac partial g k partial x i nbsp Wir ermitteln die unbekannten Multiplikatoren l k displaystyle lambda k nbsp durch Multiplikation obiger Gleichung mit der Inversen der Matrix g k x i k i displaystyle left frac partial g k partial x i right forall k i nbsp und haben damit einen kritischen Punkt d h L x i 0 displaystyle tfrac partial Lambda partial x i 0 nbsp von L displaystyle Lambda nbsp gefunden Dies ist eine notwendige Bedingung dafur dass f displaystyle f nbsp ein Extremum auf der Menge der Punkte welche die Nebenbedingungen erfullen hat D h auch hier mussen die Extrema aus der Liste der kritischen Punkte mit anderen Mitteln herausgefiltert werden Man beachte dass es deshalb insbesondere falsch ist davon zu sprechen die Lagrange Funktion zu maximieren Die Lagrange Funktion ist unbeschrankt und besitzt deshalb keine globalen Extrema und kann somit nicht maximiert werden Lediglich die kritischen Stellen der Lagrange Funktion geben Punkte an an denen die Zielfunktion bezuglich der Nebenbedingungen moglicherweise ein Maximum annimmt Hinreichende Bedingungen BearbeitenDieses Verfahren liefert nur eine notwendige Bedingung fur Extremstellen Um die Extremstellen nachzuweisen und ihre Art zu bestimmen gibt es verschiedene Kriterien Generell wird die geranderte Hesse Matrix gebildet und deren Determinante bzw bestimmte Unterdeterminanten berechnet Dieser Ansatz fuhrt aber nicht immer zu einer Aussage Alternativ kann man auch auf eine Visualisierung bzw geometrische Uberlegungen zuruckgreifen um die Art der Extremstelle festzustellen Bedeutung der Lagrange Multiplikatoren in der Physik BearbeitenDie Bedeutung der Lagrange Multiplikatoren in der Physik wird bei der Anwendung in der klassischen Mechanik sichtbar Hierfur wurden sie von Lagrange um das Jahr 1777 auch eingefuhrt Die Bewegungsgleichungen der klassischen Mechanik lassen sich im Lagrange Formalismus mit Hilfe der Euler Lagrange Gleichung aus der Bedingung gewinnen dass die Wirkung bei Variation der Koordinaten und ihrer Zeitableitungen unabhangig voneinander ein Extremum annimmt Eine physikalische Zwangsbedingung die die Bewegung einschrankt erscheint als Nebenbedingung des Extremums Der Lagrange Multiplikator mit dem die Zwangsbedingung in die Lagrange Funktion eingefugt wird steht im engen Zusammenhang zu der physikalischen Zwangskraft mit der das durch die Bewegungsgleichung beschriebene Objekt zur Einhaltung der Zwangsbedingung gebracht wird Das folgende Beispiel einer freien Punktmasse m displaystyle m nbsp die sich in zwei Dimensionen auf einer Bahn mit konstantem Radius R displaystyle R nbsp bewegt macht dieses klar Lagrange Funktion kinetische Energie in Polarkoordinaten L 1 2 m r 2 r 2 f 2 displaystyle L frac 1 2 m dot r 2 r 2 dot varphi 2 nbsp Zwangsbedingung g r R 0 displaystyle g r R 0 nbsp neue Lagrange Funktion L L l g displaystyle L prime L lambda g nbsp Euler Lagrange Gleichung hier nur fur die radiale Koordinate formuliert da die Zwangsbedingung von dieser abhangt die Winkelkoordinate ergibt die Drehimpulserhaltung fur diese Bewegung d d t L r L r 0 displaystyle frac d dt frac partial L prime partial dot r frac partial L prime partial r 0 nbsp m r m r f 2 l 0 displaystyle m ddot r mr dot varphi 2 lambda 0 nbsp mit r 0 displaystyle ddot r 0 nbsp und r R displaystyle r R nbsp sowie f w displaystyle dot varphi omega nbsp Winkelgeschwindigkeit folgt l m R w 2 displaystyle lambda mR omega 2 nbsp Das entspricht der in Polarkoordinaten formulierten Zentripetalkraft die die Punktmasse zur Bewegung auf eine Kreisbahn zwingt Verallgemeinerungen Bearbeiten Hauptartikel Lagrange Dualitat Hauptartikel Karush Kuhn Tucker Bedingungen Die Karush Kuhn Tucker Bedingungen und die Fritz John Bedingungen sind eine Verallgemeinerung der Lagrange Multiplikatoren fur Nebenbedingungen die auch durch Ungleichungen beschrieben werden Beide spielen eine wichtige Rolle in der nichtlinearen Optimierung Fur konvexe Optimierungsprobleme bei denen die Funktionen nicht stetig differenzierbar sind gibt es ausserdem die Sattelpunktkriterien der Lagrange Funktion Literatur BearbeitenOtto Forster Analysis 2 Vieweg Teubner Wiesbaden 2008 ISBN 978 3 8348 0575 1 S 110ff Michael Sauer Operations Research kompakt 1 Auflage Oldenbourg Munchen 2009 ISBN 978 3 486 59082 1 Heinrich Rommelfanger Mathematik fur Wirtschaftswissenschaftler II Band 2 2 Auflage 1992 BI Wissenschaftsverlag ISBN 9783860259818 S 238ffWeblinks BearbeitenKonzeptuelle Einleitung englisch Studienarbeit Lagrangeoptimierung inklusive Beispielrechnung und Literaturverweisen PDF 474 kB Abgerufen von https de wikipedia org w index php title Lagrange Multiplikator amp oldid 236123833