www.wikidata.de-de.nina.az
Das Newtonverfahren auch Newton Raphson Verfahren benannt nach Sir Isaac Newton 1669 und Joseph Raphson 1690 ist in der Mathematik ein haufig verwendeter Approximationsalgorithmus zur numerischen Losung von nichtlinearen Gleichungen und Gleichungssystemen Im Falle einer Gleichung mit einer Variablen lassen sich zu einer gegebenen stetig differenzierbaren Funktion f R R displaystyle f colon mathbb R to mathbb R Naherungswerte zu Losungen der Gleichung f x 0 displaystyle f x 0 d h Naherungen der Nullstellen dieser Funktion finden Die grundlegende Idee dieses Verfahrens ist die Funktion in einem Ausgangspunkt zu linearisieren d h ihre Tangente zu bestimmen und die Nullstelle der Tangente als verbesserte Naherung der Nullstelle der Funktion zu verwenden Die erhaltene Naherung dient als Ausgangspunkt fur einen weiteren Verbesserungsschritt Diese Iteration erfolgt bis die Anderung in der Naherungslosung eine festgesetzte Schranke unterschritten hat Das Iterationsverfahren konvergiert im gunstigsten Fall asymptotisch mit quadratischer Konvergenzordnung die Zahl der korrekten Dezimalstellen verdoppelt sich dann in jedem Schritt Formal ausgedruckt wird ausgehend von einem Startwert x 0 displaystyle x 0 die Iteration x n 1 x n f x n f x n displaystyle x n 1 x n frac f x n f x n wiederholt bis eine hinreichende Genauigkeit erzielt wird Inhaltsverzeichnis 1 Newtonverfahren fur reelle Funktionen einer Veranderlichen 1 1 Historisches uber das Newtonverfahren 1 2 Konstruktion am Graphen 1 3 Erstes Beispiel 2 Konvergenzbetrachtungen 2 1 Beispiele fur Nicht Konvergenz 2 2 Lokale quadratische Konvergenz 2 3 Lokale quadratische Konvergenz bei mehrfacher Nullstelle durch Modifikation 2 4 Das Newtonverfahren fur komplexe Zahlen 2 5 Bemerkungen 3 Abbruchkriterien 4 Weitere Anwendungsbeispiele 4 1 Losen eines Optimierungsproblems 4 2 Berechnung der Quadratwurzel 4 3 Berechnung der Kubikwurzel 4 4 Schnittpunkt zweier Funktionen 4 5 Gemischt goniometrische Funktion 5 Das Newtonverfahren im Mehrdimensionalen 6 Varianten des Newtonverfahrens 6 1 Vereinfachtes Newtonverfahren 6 2 Inexaktes Newtonverfahren 6 3 Newton Krylow Verfahren 7 Siehe auch 8 Literatur 9 Weblinks 10 EinzelnachweiseNewtonverfahren fur reelle Funktionen einer Veranderlichen BearbeitenHistorisches uber das Newtonverfahren Bearbeiten Isaac Newton verfasste im Zeitraum 1664 bis 1671 die Arbeit Methodus fluxionum et serierum infinitarum latein fur Von der Methode der Fluxionen und unendlichen Folgen Darin erklart er einen neuen Algorithmus zum Losen einer polynomialen Gleichung am Beispiel y 3 2 y 5 0 displaystyle y 3 2y 5 0 nbsp Dazu kann man leicht den Punkt y 2 displaystyle y 2 nbsp als erste Naherung raten Newton machte den Ansatz y 2 p displaystyle y 2 p nbsp mit einem als klein angenommenen p displaystyle p nbsp und setzte diesen in die Gleichung ein Nach den binomischen Formeln gilt y 3 2 p 3 8 12 p 6 p 2 p 3 displaystyle y 3 2 p 3 8 12p 6p 2 p 3 nbsp 2 y 2 2 p 4 2 p displaystyle 2y 2 2 p 4 2p nbsp 0 y 3 2 y 5 1 10 p 6 p 2 p 3 displaystyle Rightarrow 0 y 3 2y 5 1 10p 6p 2 p 3 nbsp Da p displaystyle p nbsp klein sein soll konnen die Terme hoherer Ordnung gegenuber den linearen und konstanten vernachlassigt werden womit 10 p 1 0 displaystyle 10p 1 0 nbsp bzw p 0 1 displaystyle p 0 1 nbsp ubrig bleibt Wir konnen nun dieses Vorgehen wiederholen und p 0 1 q displaystyle p 0 1 q nbsp ansetzen in die zweite Gleichung einsetzen hohere Terme weglassen und q 0 061 11 23 0 005 4 displaystyle q 0 061 11 23 0 0054 dots nbsp erhalten Joseph Raphson beschrieb 1690 in der Arbeit Analysis Aequationum universalis diesen Rechenprozess formal und illustrierte den Formalismus an der allgemeinen Gleichung dritten Grades wobei er die nachfolgende Iterationsvorschrift fand 1 Die abstrakte Form des Verfahrens mit Benutzung der Ableitung x n 1 x n f x n f x n displaystyle x n 1 x n frac f x n f x n nbsp stammt von Thomas Simpson Konstruktion am Graphen Bearbeiten nbsp Animation Iteration mit dem newtonschen VerfahrenAnschaulich gelangt man wie folgt zu diesem Verfahren Sei f R R displaystyle f colon mathbb R to mathbb R nbsp eine stetig differenzierbare reelle Funktion von der wir eine Stelle x n displaystyle x n nbsp im Definitionsbereich mit kleinem Funktionswert kennen Wir wollen einen Punkt x n 1 displaystyle x n 1 nbsp nahe x n displaystyle x n nbsp finden der eine verbesserte Naherung der Nullstelle darstellt Dazu linearisieren wir die Funktion f displaystyle f nbsp an der Stelle x n displaystyle x n nbsp d h wir ersetzen sie durch ihre Tangente im Punkt P x n f x n displaystyle P x n f x n nbsp mit Anstieg f x n displaystyle f prime x n nbsp Die Tangente ist durch die Funktion t x n h f x n f x n h displaystyle t x n h f x n f prime x n h nbsp gegeben Setzen wir h x x n displaystyle h x x n nbsp ein so erhalten wir t x f x n f x n x x n displaystyle t x f x n f prime x n x x n nbsp Wir wahlen als x n 1 displaystyle x n 1 nbsp die einzige Nullstelle dieser linearen Funktion 0 t x n 1 f x n f x n x n 1 x n x n 1 x n f x n f x n displaystyle 0 t x n 1 f x n f prime x n x n 1 x n quad Rightarrow quad x n 1 x n f x n f x n nbsp Wenden wir diese Konstruktion mehrfach an so erhalten wir aus einer ersten Stelle x 0 displaystyle x 0 nbsp eine unendliche Folge von Stellen x n n N displaystyle x n n in mathbb N nbsp die durch die Rekursionsvorschrift x n 1 N f x n x n f x n f x n displaystyle x n 1 N f x n x n frac f x n f x n nbsp dd definiert ist Diese Vorschrift wird auch als Newton iteration bezeichnet die Funktion N f displaystyle N f nbsp als Newtonoperator Die Newtoniteration ist ein spezieller Fall einer Fixpunktiteration falls die Folge gegen 3 lim n x n displaystyle xi lim n to infty x n nbsp konvergiert so gilt 3 N f 3 3 f 3 f 3 displaystyle xi N f xi xi f xi f xi nbsp und daher f 3 0 displaystyle f xi 0 nbsp Die Kunst der Anwendung des Newtonverfahrens besteht darin geeignete Startwerte x 0 displaystyle x 0 nbsp zu finden Je mehr uber die Funktion f displaystyle f nbsp bekannt ist desto kleiner lasst sich die notwendige Menge von Startwerten gestalten Viele nichtlineare Gleichungen haben mehrere Losungen so hat ein Polynom n displaystyle n nbsp ten Grades bis zu n displaystyle n nbsp Nullstellen Will man alle Nullstellen in einem bestimmten Bereich D R displaystyle D subseteq mathbb R nbsp ermitteln so muss zu jeder Nullstelle ein passender Startwert in D displaystyle D nbsp gefunden werden fur den die Newtoniteration konvergiert Dazu konnte man z B per Bisektion genugend kleine isolierende Intervalle zu jeder Nullstelle bestimmen Erstes Beispiel Bearbeiten Die Quadratwurzel einer Zahl a gt 0 displaystyle a gt 0 nbsp ist die positive Nullstelle der Funktion f x 1 a x 2 displaystyle f x 1 a x 2 nbsp Diese Funktion hat die Ableitung f x 2 a x 3 displaystyle f prime x 2a x 3 nbsp die Newtoniteration erfolgt also nach der Vorschrift x n 1 N f x n x n 1 a x n 2 2 a x n 3 x n x n 3 2 a x n 2 x n 2 3 x n 2 a displaystyle x n 1 N f x n x n frac 1 a x n 2 2a x n 3 x n frac x n 3 2a frac x n 2 frac x n 2 left 3 frac x n 2 a right nbsp Der Vorteil dieser Vorschrift gegenuber dem Wurzelziehen nach Heron siehe unten ist dass es divisionsfrei ist sobald einmal der Kehrwert von a displaystyle a nbsp bestimmt wurde Als Startwert wurde in der Tabelle x 0 1 a 2 displaystyle x 0 1 a 2 nbsp gewahlt Die Iterierten wurden an der ersten ungenauen Stelle abgeschnitten Es ist zu erkennen dass nach wenigen Schritten die Anzahl gultiger Stellen schnell wachst n x n displaystyle x n nbsp bei a 2 displaystyle a 2 nbsp x n displaystyle x n nbsp bei a 3 displaystyle a 3 nbsp x n displaystyle x n nbsp bei a 5 displaystyle a 5 nbsp 0 1 5 displaystyle 1 5 nbsp 2 displaystyle 2 nbsp 3 displaystyle 3 nbsp 1 1 40 displaystyle 1 40 nbsp 1 6 displaystyle 1 6 nbsp 1 8 displaystyle 1 8 nbsp 2 1 414 displaystyle 1 414 nbsp 1 72 displaystyle 1 72 nbsp 2 1 displaystyle 2 1 nbsp 3 1 414 213514 displaystyle 1 414213514 nbsp 1 732 03 displaystyle 1 73203 nbsp 2 22 displaystyle 2 22 nbsp 4 1 414 21356237309502 displaystyle 1 41421356237309502 nbsp 1 732 0508074 displaystyle 1 7320508074 nbsp 2 236 01 displaystyle 2 23601 nbsp 5 1 414 213562373095048801688724209697 displaystyle 1 414213562373095048801688724209697 nbsp 1 732 05080756887729351 displaystyle 1 73205080756887729351 nbsp 2 236 067975 displaystyle 2 236067975 nbsp 6 1 414 213562373095048801688724209698 displaystyle 1 414213562373095048801688724209698 nbsp 1 732 0508075688772935274463415058723669426 displaystyle 1 7320508075688772935274463415058723669426 nbsp 2 236 067977499789692 displaystyle 2 236067977499789692 nbsp 7 1 414 213562373095048801688724209698 displaystyle 1 414213562373095048801688724209698 nbsp 1 732 0508075688772935274463415058723669428 displaystyle 1 7320508075688772935274463415058723669428 nbsp 2 236 06797749978969640917366873127622 displaystyle 2 23606797749978969640917366873127622 nbsp 8 1 414 213562373095048801688724209698 displaystyle 1 414213562373095048801688724209698 nbsp 1 732 0508075688772935274463415058723669428 displaystyle 1 7320508075688772935274463415058723669428 nbsp 2 236 06797749978969640917366873127623 displaystyle 2 23606797749978969640917366873127623 nbsp Betrachten wir die Differenz x n 1 a displaystyle x n 1 sqrt a nbsp zum Grenzwert im n 1 displaystyle n 1 nbsp ten Schritt so kann mittels der binomischen Formeln die Differenz im n displaystyle n nbsp ten Schritt zweimal abgespalten werden x n 1 a 3 2 x n x n 3 2 a 3 2 a a 3 2 a x n a 3 2 x n 2 x n a a 2 a displaystyle x n 1 sqrt a frac 3 2 x n frac x n 3 2a frac 3 2 sqrt a frac sqrt a 3 2a x n sqrt a cdot left frac 3 2 frac x n 2 x n sqrt a a 2a right nbsp x n a a x n 2 a x n a 2 a x n a 2 x n 2 a 2 a displaystyle x n sqrt a cdot frac a x n 2 a x n sqrt a 2a x n sqrt a 2 cdot frac x n 2 sqrt a 2a nbsp dd dd Nach der Ungleichung vom arithmetischen und geometrischen Mittel gilt 0 lt a 1 a 2 displaystyle 0 lt sqrt a leq tfrac 1 a 2 nbsp so dass der zweite Faktor sinnvoll durch 3 2 1 a displaystyle 3 2 1 a nbsp beschrankt werden kann Ist die Differenz im n displaystyle n nbsp ten Schritt eine kleine Zahl so ist die Differenz im n 1 displaystyle n 1 nbsp ten Schritt proportional zum Quadrat davon also wesentlich kleiner So entsteht durch Quadrieren eines Fehlers 10 m displaystyle 10 m nbsp eine Fehlerabschatzung proportional zu 10 2 m displaystyle 10 2m nbsp Deshalb spricht man davon dass sich die Anzahl der gultigen Stellen in jedem Schritt der Newtoniteration ungefahr verdoppelt Konvergenzbetrachtungen Bearbeiten nbsp Das Newtonverfahren fur das Polynom z 3 1 displaystyle z 3 1 nbsp uber den komplexen Zahlen konvergiert fur Startwerte aus den roten den grunen und den blauen Bereichen jeweils zu einer der drei Nullstellen des Polynoms Fur Startwerte aus der hellen Struktur dem Newtonfraktal konvergiert das Verfahren nicht Das Newtonverfahren ist ein sogenanntes lokal konvergentes Verfahren Konvergenz der in der Newtoniteration erzeugten Folge zu einer Nullstelle ist also nur garantiert wenn der Startwert d h das 0 te Glied der Folge schon ausreichend nahe an der Nullstelle liegt Ist der Startwert zu weit entfernt ist das Konvergenzverhalten nicht festgelegt das heisst es ist sowohl eine Divergenz der Folge moglich als auch eine Oszillation bei der sich endlich viele Funktionswerte abwechseln oder eine Konvergenz gegen eine andere Nullstelle der betrachteten Funktion nbsp Dynamik des Newtonverfahrens fur die Funktion x 3 2 x 2 displaystyle x 3 2x 2 nbsp mit Startwerten zwischen 4 und 4 Jede farbcodierte Zeile zeigt das Resultat eines Schritts des Verfahrens angewandt auf die jeweils daruberliegende Zeile Die Startwerte befinden sich in der obersten Zeile Viele Startwerte konvergieren gegen die einzige reellwertige Nullstelle des Polynoms bei ca 1 769 deren Farbe Mittelblau ist Es gibt jedoch auch viele Startwerte fur welche das Verfahren nicht konvergiert und zwischen null schwarz und eins rot hin und herpendelt Die Menge dieser nicht zur Nullstelle fuhrenden Startwerte enthalt offene Intervalle ist also eine Menge von positivem Mass und damit insbesondere keine Nullmenge Ist der Startwert x 0 displaystyle x 0 nbsp so gewahlt dass das Newtonverfahren konvergiert so ist die Konvergenz allerdings quadratisch also mit der Konvergenzordnung 2 falls die Ableitung an der Nullstelle nicht verschwindet Die Menge der Startpunkte fur die das Newtonverfahren gegen eine bestimmte Nullstelle konvergiert bildet den Einzugsbereich dieser Nullstelle Farbt man fur eine Polynomfunktion mit reellen oder komplexen Koeffizienten die Einzugsbereiche verschiedener Nullstellen in der komplexen Ebene unterschiedlich ein so ergibt sich ein Newtonfraktal In diesem ist zu erkennen dass die Einzugsbereiche Bassins d h Kreisscheiben um die Nullstellen enthalten aus welchen heraus die Newtoniteration stabil gegen die Nullstelle im Zentrum konvergiert Aber es ist auch zu erkennen dass die Rander der Einzugsbereiche ausgefranst sind sie haben sogar eine fraktale Struktur Geringe Abweichungen im Startpunkt konnen also zu unterschiedlichen Nullstellen fuhren Falls es jedoch im Intervall I a b displaystyle I a b nbsp genau eine Nullstelle gibt in I displaystyle I nbsp durchweg f gt 0 displaystyle f gt 0 nbsp sowie f lt 0 displaystyle f lt 0 nbsp gilt und der Startwert x 0 I displaystyle x 0 in I nbsp links von der Nullstelle 3 I displaystyle xi in I nbsp gewahlt wird dann konvergiert die Folge im Newtonverfahren stets und zwar streng monoton wachsend siehe Abbildung unten bzw die Tabelle oben ab n 1 displaystyle n 1 nbsp Beispiele fur Nicht Konvergenz Bearbeiten Oszillierendes Verhalten ergibt sich u a fur das Polynom f x x 3 2 x 2 displaystyle f x x 3 2x 2 nbsp 2 mit f x 3 x 2 2 displaystyle f prime x 3x 2 2 nbsp Der Punkt x 0 displaystyle x 0 nbsp mit f 0 2 displaystyle f 0 2 nbsp und f 0 2 displaystyle f prime 0 2 nbsp wird durch den Newtonoperator auf den Punkt N 0 0 2 2 1 displaystyle N 0 0 2 2 1 nbsp abgebildet der Punkt x 1 displaystyle x 1 nbsp wiederum mit f 1 1 displaystyle f 1 1 nbsp und f 1 1 displaystyle f prime 1 1 nbsp wird auf N 1 1 1 1 0 displaystyle N 1 1 1 1 0 nbsp abgebildet so dass die Newtoniteration mit einem dieser Punkte als Startwert eine periodische Folge ergibt diese beiden Punkte wechseln sich zyklisch ab Dieser Zyklus ist stabil er bildet einen Attraktor der Newtoniteration Das bedeutet um beide Punkte gibt es Umgebungen so dass Startpunkte aus diesen Umgebungen gegen den Zyklus konvergieren und somit je einen der Punkte 0 und 1 als Grenzwert der Teilfolge mit geradem Index und der mit ungeradem Index haben Divergenz bzw beliebig weites Entfernen vom Startpunkt ergibt sich fur f x sin x displaystyle f x sin x nbsp mit f x cos x displaystyle f prime x cos x nbsp und N x x tan x displaystyle N x x tan x nbsp Es gibt eine Stelle x 0 p 2 0 displaystyle x 0 in lbrack pi 2 0 rbrack nbsp mit tan x 0 2 p displaystyle tan x 0 2 pi nbsp d h x 0 arctan 2 p 1 412 965136506737759 displaystyle x 0 arctan 2 pi 1 412965136506737759 dots nbsp Man uberzeugt sich dass dann x n x 0 2 p n displaystyle x n x 0 2 pi n nbsp gilt Dieses Verhalten ist nicht stabil denn bei leichter Variation des Anfangswertes wie sie zum Beispiel durch die numerische Berechnung entsteht entfernt sich die Newtoniteration immer weiter von der idealen divergierenden Folge Selbst bei schliesslicher Konvergenz wird die gefundene Nullstelle sehr weit vom Startwert entfernt sein Lokale quadratische Konvergenz Bearbeiten Sei f displaystyle f nbsp eine zweimal stetig differenzierbare reelle Funktion und a displaystyle a nbsp eine einfache Nullstelle von f displaystyle f nbsp in welcher die Ableitung somit keine Nullstelle hat Das bedeutet dass der Graph der Funktion transversal d h nicht beruhrend die x displaystyle x nbsp Achse schneidet Sei x displaystyle x nbsp ein Punkt nahe bei a displaystyle a nbsp Dann kann die Taylorformel zweiten Grades mit Lagrange Restglied 0 f a f x f x a x 1 2 f 3 a x 2 3 displaystyle 0 f a f x f x a x tfrac 1 2 f xi a x 2 qquad xi nbsp liegt zwischen x displaystyle x nbsp und a displaystyle a nbsp nach der Differenz x a displaystyle x a nbsp umgestellt werden x a f x f x f 3 2 f x x a 2 displaystyle x a frac f x f x frac f xi 2 f x x a 2 nbsp Es wird nun so umgestellt dass der Newtonoperator auf der rechten Seite erscheint N f x a x f x f x a f 3 2 f x x a 2 displaystyle N f x a x frac f x f x a frac f xi 2 f x x a 2 nbsp Seien I displaystyle I nbsp ein Intervall um a displaystyle a nbsp ohne Nullstelle der Ableitung f x displaystyle f x nbsp und m 1 min x I f x displaystyle m 1 min x in I f x nbsp sowie M 2 max x I f x displaystyle M 2 max x in I f x nbsp Schranken der Ableitungen von f displaystyle f nbsp Dann folgt fur alle x I displaystyle x in I nbsp die Abschatzung N f x a M 2 2 m 1 x a 2 displaystyle Bigl N f x a Bigr leq frac M 2 2m 1 x a 2 nbsp Mit K M 2 2 m 1 displaystyle K tfrac M 2 2m 1 nbsp sei der konstante Faktor bezeichnet In jedem Schritt n displaystyle n nbsp der Newtoniteration wird die Grosse d n K x n a displaystyle d n K x n a nbsp kleiner sein als das Quadrat derselben Grosse im vorhergehenden Schritt d n K K x n 1 a 2 d n 1 2 displaystyle d n leq K cdot K x n 1 a 2 d n 1 2 nbsp Nach vollstandiger Induktion ergibt sich K x n a d n d n 1 2 d n 2 4 d 0 2 n K x 0 a 2 n displaystyle K x n a d n leq d n 1 2 leq d n 2 4 leq dotsb leq d 0 2 n K x 0 a 2 n nbsp Kann also fur den Startpunkt der Iteration die Abschatzung x 0 a lt 1 K displaystyle x 0 a lt tfrac 1 K nbsp garantiert werden z B indem die Intervalllange von I displaystyle I nbsp kleiner als 1 K displaystyle 1 K nbsp ist so konvergiert die Folge x n displaystyle x n nbsp der Newtoniteration gegen die Nullstelle a displaystyle a nbsp denn die Folge d n n N displaystyle d n n in mathbb N nbsp und damit x n 1 K d n n N displaystyle x n tfrac 1 K d n n in mathbb N nbsp ist nach der angegebenen Abschatzung eine Nullfolge Die Verkurzung des Intervalls kann durch einige Iterationen eines langsameren Verfahrens zur Nullstelleneinschrankung erreicht werden z B des Bisektionsverfahrens oder der Regula falsi Die aus dieser Abschatzungen folgende Konvergenzgeschwindigkeit wird als quadratisch bezeichnet die logarithmische Genauigkeit bzw Anzahl gultiger Stellen verdoppelt sich in jedem Schritt Die Abschatzung des Abstands x n a displaystyle x n a nbsp zur Nullstelle wird oft linear in x 0 a displaystyle x 0 a nbsp angegeben so gilt z B x n a 1 2 2 n 1 x 0 a displaystyle x n a leq left tfrac 1 2 right 2 n 1 cdot x 0 a nbsp falls die Lange des Intervalls I displaystyle I nbsp kleiner als 1 2 K displaystyle tfrac 1 2K nbsp ist Dies ergibt eine Abschatzung der gultigen Stellen im Binarsystem x n a 1 10 2 n 1 x 0 a displaystyle x n a leq left tfrac 1 10 right 2 n 1 cdot x 0 a nbsp falls die Lange des Intervalls I displaystyle I nbsp kleiner als 1 10 K displaystyle tfrac 1 10K nbsp ist d h nahe genug an der Nullstelle ergibt sich eine Verdopplung der gultigen Dezimalstellen in jedem Schritt Lokale quadratische Konvergenz bei mehrfacher Nullstelle durch Modifikation Bearbeiten Fur den Fall dass f displaystyle f nbsp bei a displaystyle a nbsp eine mehrfache Nullstelle endlichen Grades besitzt lasst sich ebenfalls die Konvergenzgeschwindigkeit abschatzen und durch eine geringfugige Modifikation wieder quadratische Konvergenz erzwingen Hat f displaystyle f nbsp bei a displaystyle a nbsp eine k displaystyle k nbsp fache Nullstelle lasst sich f displaystyle f nbsp schreiben als f x x a k g x displaystyle f x x a k cdot g x nbsp mit g a 0 displaystyle g a neq 0 nbsp Dann ist nach der Produktregel f x k x a k 1 g x x a k g x displaystyle f x k cdot x a k 1 cdot g x x a k cdot g x nbsp und damit der Ausdruck f x f x x a k g x k x a k 1 g x x a k g x x a g x k g x x a g x displaystyle frac f x f x frac x a k cdot g x k cdot x a k 1 cdot g x x a k cdot g x x a frac g x k cdot g x x a cdot g x nbsp Setzt man dies nun in die Iteration ein so erhalt man x neu x f x f x x x a g x k g x x a g x displaystyle x text neu x frac f x f x x x a frac g x k cdot g x x a cdot g x nbsp und daraus nach beidseitiger Subtraktion von a displaystyle a nbsp den Iterationsfehler x neu a x a x a g x k g x x a g x x a 1 g x k g x x a g x displaystyle x text neu a x a x a frac g x k cdot g x x a cdot g x x a left 1 frac g x k cdot g x x a cdot g x right nbsp displaystyle nbsp Wenn nun der Ausdruck x a displaystyle x a nbsp sehr klein geworden ist wird der Summand x a g x displaystyle x a cdot g x nbsp im Nenner viel kleiner als k g x displaystyle k cdot g x nbsp so dass sich die hintere Klammer in displaystyle nbsp immer mehr dem Wert s 1 1 k displaystyle s 1 tfrac 1 k nbsp nahert Fur die einfache Nullstelle mit k 1 displaystyle k 1 nbsp hat man einen kleinen Wert s displaystyle s nbsp der fast 0 wird so dass x neu a x a s displaystyle x text neu a x a cdot s nbsp wird Fur k 2 displaystyle k 2 nbsp wird s displaystyle s nbsp ungefahr 0 5 so dass sich der Abstand zur Nullstelle von Schritt zu Schritt nur etwa halbiert und man nach etwa 10 Schritten die Genauigkeit nur in weiteren drei Dezimalstellen erhoht hat Bei k 3 displaystyle k 3 nbsp wird s displaystyle s nbsp etwa 0 67 so dass erst nach etwa 16 Schritten die Genauigkeit um weitere drei Dezimalstellen steigt usw Man kann daher am Konvergenzverhalten die Vielfachheit der Nullstelle abschatzen falls man sie nicht aus anderen Grunden weiss und wie nun noch beschrieben das Verfahren optimieren Bei einer k displaystyle k nbsp fachen Nullstelle modifiziert man das newtonsche Naherungsverfahren mit einem Faktor k displaystyle k nbsp x neu x k f x f x displaystyle x text neu x k cdot frac f x f x nbsp Newtonverfahren bei k displaystyle k nbsp facher Nullstelle Damit wird dann displaystyle nbsp zu x neu a x a 1 k g x k g x x a g x x a k g x x a g x k g x x a g x k g x k g x x a g x x a x a g x k g x x a g x x a 2 g x k g x x a g x displaystyle begin aligned x text neu a amp x a left 1 frac k cdot g x k cdot g x x a cdot g x right amp x a left frac k cdot g x x a cdot g x k cdot g x x a cdot g x frac k cdot g x k cdot g x x a cdot g x right amp x a frac x a cdot g x k cdot g x x a cdot g x amp x a 2 frac g x k cdot g x x a cdot g x end aligned nbsp Ist nun x a displaystyle x a nbsp wieder sehr klein so wird im Nenner der Summand x a g x displaystyle x a cdot g x nbsp viel kleiner als k g x displaystyle k cdot g x nbsp und man erhalt x neu a x a 2 g x k g x displaystyle x text neu a x a 2 frac g x k cdot g x nbsp wobei der rechte Faktor wegen g a 0 displaystyle g a neq 0 nbsp gegen einen festen Wert konvergiert Wie man sieht liegt nun auch hier quadratische Konvergenz vor Ein Beispiel zeigt das Konvergenzverhalten sehr schon Die Funktion f x x 2 2 displaystyle f x x 2 2 nbsp hat die einfache Nullstelle 2 displaystyle sqrt 2 nbsp Die linke Spalte der Tabelle zeigt die rasche Konvergenz fur den Startwert 1 nach 4 Schritten lasst sich die Genauigkeit nicht mehr steigern beim Fehler verdoppelt sich die Anzahl der Nullen hinterm Komma mindestens Quadriert man nun die Funktion mittlere Spalte wird die Nullstelle eine doppelte und nun zeigt sich das oben erlauterte Verhalten dass sich ohne Modifikation der Fehler in jedem Schritt nur etwa halbiert Modifiziert man dann diesen Fall mit dem Faktor k 2 displaystyle k 2 nbsp so stellt sich dasselbe Verhalten wie bei der einfachen Nullstelle ein rechte Spalte n x n displaystyle x n nbsp fur f x x 2 2 displaystyle f x x 2 2 nbsp Fehler x n displaystyle x n nbsp fur f x x 2 2 2 displaystyle f x x 2 2 2 nbsp ohne Faktor k displaystyle k nbsp Fehler x n displaystyle x n nbsp fur f x x 2 2 2 displaystyle f x x 2 2 2 nbsp mit Faktor k 2 displaystyle k 2 nbsp Fehler0 1 displaystyle 1 nbsp 0 414 2135 displaystyle 0 4142135 nbsp 1 displaystyle 1 nbsp 0 414 2135 displaystyle 0 4142135 nbsp 1 displaystyle 1 nbsp 0 414 2135 displaystyle 0 4142135 nbsp 1 1 5 displaystyle 1 5 nbsp 0 085 7864 displaystyle 0 0857864 nbsp 1 25 displaystyle 1 25 nbsp 0 164 2135 displaystyle 0 1642135 nbsp 1 5 displaystyle 1 5 nbsp 0 085 7864 displaystyle 0 0857864 nbsp 2 1 416 66667 displaystyle 1 41666667 nbsp 0 002 4531 displaystyle 0 0024531 nbsp 1 337 5 displaystyle 1 3375 nbsp 0 076 71356 displaystyle 0 07671356 nbsp 1 416 66667 displaystyle 1 41666667 nbsp 0 002 4531 displaystyle 0 0024531 nbsp 3 1 414 21569 displaystyle 1 41421569 nbsp 0 000 0021 displaystyle 0 0000021 nbsp 1 376 95678 displaystyle 1 37695678 nbsp 0 037 25679 displaystyle 0 03725679 nbsp 1 414 21569 displaystyle 1 41421569 nbsp 0 000 0021 displaystyle 0 0000021 nbsp 4 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 395 83719 displaystyle 1 39583719 nbsp 0 018 37638 displaystyle 0 01837638 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 5 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 405 08586 displaystyle 1 40508586 nbsp 0 009 12771 displaystyle 0 00912771 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 6 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 409 66453 displaystyle 1 40966453 nbsp 0 004 54903 displaystyle 0 00454903 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 7 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 411 94272 displaystyle 1 41194272 nbsp 0 002 27084 displaystyle 0 00227084 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 8 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 413 07905 displaystyle 1 41307905 nbsp 0 001 13451 displaystyle 0 00113451 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 9 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 413 64654 displaystyle 1 41364654 nbsp 0 000 56703 displaystyle 0 00056703 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 10 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp 1 413 93011 displaystyle 1 41393011 nbsp 0 000 14171 displaystyle 0 00014171 nbsp 1 414 21356 displaystyle 1 41421356 nbsp 0 displaystyle 0 nbsp Das Newtonverfahren fur komplexe Zahlen Bearbeiten Fur komplexe Zahlen z displaystyle z nbsp schreibt man die Formel entsprechend 1 z 1 z 0 f z 0 f z 0 displaystyle 1 z 1 z 0 frac f z 0 f z 0 nbsp mit der holomorphen Funktion f z z x i y i 2 1 x y R displaystyle f z z x iy i 2 1 x y in mathbb R nbsp Die Zerlegung in Real und Imaginarteil ergibt f z u x y i v x y displaystyle f z u x y iv x y nbsp Die komplexe Ableitung ist unabhangig von der Richtung der Ableitung an der Stelle z displaystyle z nbsp d h es gilt d d z f z x f z i y f z i y f z displaystyle frac d dz f z frac partial partial x f z frac partial partial iy f z frac partial i partial y f z nbsp Daher gelten die Cauchy Riemann schen Differentialgleichungen 2 u x v y displaystyle 2 u x v y nbsp und v x u y displaystyle v x u y nbsp Die komplexe Gleichung 1 kann in Real und Imaginarteil zerlegt werden 3 f z f z f z f z f z f z u i v u x i v x u x 2 v x 2 displaystyle 3 frac f z f z frac f z cdot overline f z f z cdot overline f z frac u iv cdot u x iv x u x 2 v x 2 nbsp Mit Hilfe 2 folgt hieraus f z f z 1 u x 2 v x 2 u u x v v x i u u y v v y displaystyle frac f z f z frac 1 u x 2 v x 2 cdot left left u cdot u x v cdot v x right i left u cdot u y v cdot v y right right nbsp Die geometrische Bedeutung dieser Gleichung sieht man wie folgt Man bestimmt das Minimum vom Betrag f z displaystyle vert f z vert nbsp Das Minimum wird fur f z 0 displaystyle f z 0 nbsp angenommen Dies kann mit dem Gradientenverfahren d h mit der Methode des steilsten Abstiegs bestimmt werden Man fuhrt die Bezeichnung b x y f z u 2 v 2 displaystyle b x y vert f z vert sqrt u 2 v 2 nbsp ein Die Formel fur diese Methode lautet mit dem Vektor x x y displaystyle vec x left begin array 20 c x y end array right nbsp 4 x 1 x 0 b x 0 y 0 b x 0 y 0 2 b x 0 y 0 displaystyle 4 vec x 1 vec x 0 frac b x 0 y 0 left nabla b x 0 y 0 right 2 cdot nabla b x 0 y 0 nbsp Dies ist mit der Formel 1 identisch Bemerkungen Bearbeiten Der lokale Konvergenzbeweis kann auch auf die gleiche Weise im mehrdimensionalen Fall gefuhrt werden allerdings ist er dann technisch etwas schwieriger da mit zwei und dreistufigen Tensoren fur die erste bzw zweite Ableitung gearbeitet wird Im Wesentlichen ist die Konstante K durch K 1 2 sup x U f x 1 1 1 sup x U f x 1 2 displaystyle K tfrac 1 2 sup x in U f x 1 1 1 sup x in U f x 1 2 nbsp zu ersetzen mit geeigneten induzierten Operatornormen Der lokale Konvergenzbeweis setzt voraus dass ein eine Nullstelle enthaltendes Intervall bekannt ist Aus seinem Beweis ergibt sich aber keine Moglichkeit dies schnell zu testen Ein Konvergenzbeweis der auch hierfur ein Kriterium liefert wurde zuerst von Leonid Kantorowitsch gefuhrt und ist als Satz von Kantorowitsch bekannt Um einen geeigneten Startpunkt zu finden verwendet man gelegentlich andere grobere Verfahren Beispielsweise kann man mit dem Gradientenverfahren eine ungefahre Losung ermitteln und diese dann mit dem Newtonverfahren verfeinern Bei unbekanntem Startpunkt kann man mittels einer Homotopie die Funktion f displaystyle f nbsp von der man eine Nullstelle sucht zu einer einfacheren Funktion g displaystyle g nbsp deformieren von der mindestens eine Nullstelle bekannt ist Man durchlauft dann die Deformation ruckwarts in Form einer endlichen Folge sich nur wenig unterscheidender Funktionen Von der ersten Funktion g displaystyle g nbsp kennt man eine Nullstelle Als Startwert der Newtoniteration zur gerade aktuellen Funktion der Folge verwendet man die Naherung einer Nullstelle der in der Folge vorhergehenden Funktion Zum genauen Vorgehen siehe Homotopieverfahren Als Beispiel mag die Flutungshomotopie dienen mit einem willkurlichen z displaystyle z nbsp bilden wir die Ausgangsfunktion g x f 0 x f x f z displaystyle g x f 0 x f x f z nbsp mit bekannter Nullstelle z displaystyle z nbsp Wir haben den Wasserspiegel vom Nullpegel auf die Hohe f z displaystyle f z nbsp geflutet Nun senken wir schrittweise den Wasserstand f n x f x f z n h f z displaystyle f n x f x f z n cdot h cdot f z nbsp h 1 N displaystyle h 1 N nbsp n 1 N displaystyle n 1 dots N nbsp In jedem Schritt wird eine Naherung 3 n displaystyle xi n nbsp einer Nullstelle bestimmt wobei x 0 3 n 1 displaystyle x 0 xi n 1 nbsp gesetzt wird Es ist f N f displaystyle f N f nbsp und somit 3 N displaystyle xi N nbsp eine der gesuchten Naherungslosungen dd nbsp Das newtonsche NaherungsverfahrenAbbruchkriterien BearbeitenMogliche Abbruchkriterien bezuglich einer Restgrosse zum Beispiel Rechner Arithmetik sind f x n lt e 1 o d e r x n 1 x n lt e 2 displaystyle f x n lt varepsilon 1 qquad mathrm oder qquad x n 1 x n lt varepsilon 2 nbsp Wobei e 1 e 2 R displaystyle varepsilon 1 varepsilon 2 in mathbb R nbsp die Qualitat der Nullstelle bestimmt In beiden Fallen kann es vorkommen dass das Abbruchkriterium zu einem schlechten Zeitpunkt erfullt ist Weitere Anwendungsbeispiele BearbeitenLosen eines Optimierungsproblems Bearbeiten Das Newtonverfahren kann verwendet werden um einen Extremwert einer Funktion f R R displaystyle f colon mathbb R to mathbb R nbsp zu finden Dafur sucht man mit dem Verfahren nach einem Kritischen Punkt d h nach einer Nullstelle in der ersten Ableitung der Funktion Der Iterationsschritt sieht demnach wie folgt aus x n 1 x n f x n f x n displaystyle x n 1 x n frac f x n f x n nbsp Fur eine Funktion f R n R displaystyle f colon mathbb R n to mathbb R nbsp mit mehreren Eingangsvariablen x R n displaystyle mathbf x in mathbb R n nbsp verwendet man analog die Jacobimatrix J R n 1 displaystyle J in mathbb R n times 1 nbsp und die inverse Hessematrix H R n n displaystyle H in mathbb R n times n nbsp siehe auch Das Newtonverfahren im Mehrdimensionalen x n 1 x n H x n 1 J x n displaystyle mathbf x n 1 mathbf x n H mathbf x n 1 J mathbf x n nbsp Berechnung der Quadratwurzel Bearbeiten Ein Spezialfall des newtonschen Naherungsverfahrens ist das babylonische Wurzelziehen auch bekannt als Heronverfahren nach Heron von Alexandria Wendet man die Iterationsformel zur Nullstellenbestimmung auf die Funktion f x x 2 a displaystyle f x x 2 a nbsp an so erhalt man wegen der Ableitungsfunktion f x 2 x displaystyle f x 2x nbsp fur die Losung a displaystyle sqrt a nbsp das Naherungsverfahren x n 1 x n x n 2 a 2 x n 2 x n 2 x n 2 a 2 x n 1 2 x n a x n displaystyle x n 1 x n frac x n 2 a 2x n frac 2x n 2 x n 2 a 2x n frac 1 2 left x n frac a x n right nbsp Dieses Verfahren konvergiert fur jedes a 0 displaystyle a geq 0 nbsp und fur jeden beliebigen Anfangswert x 0 0 displaystyle x 0 neq 0 nbsp Berechnung der Kubikwurzel Bearbeiten Wendet man die Iterationsformel zur Nullstellenbestimmung auf die Funktion f x x 3 a displaystyle f x x 3 a nbsp an so erhalt man wegen der Ableitungsfunktion f x 3 x 2 displaystyle f x 3x 2 nbsp fur die Losung a 3 displaystyle sqrt 3 a nbsp das Naherungsverfahren x n 1 x n x n 3 a 3 x n 2 x n 1 3 x n a x n 2 1 3 2 x n a x n 2 displaystyle x n 1 x n frac x n 3 a 3x n 2 x n frac 1 3 left x n frac a x n 2 right frac 1 3 left 2x n frac a x n 2 right nbsp Fur negative Radikanden empfiehlt sich die Umrechnung mit x 3 x 3 displaystyle sqrt 3 x sqrt 3 x nbsp Dieses Verfahren konvergiert fur a displaystyle a nbsp und Anfangswert x 0 0 displaystyle x 0 neq 0 nbsp wenn a displaystyle a nbsp und x 0 displaystyle x 0 nbsp gleiches Vorzeichen haben Schnittpunkt zweier Funktionen Bearbeiten Auf ahnliche Weise lasst sich auch der x displaystyle x nbsp Wert des Schnittpunktes zweier Funktionen g x displaystyle g x nbsp und f x displaystyle f x nbsp bestimmen Da man die beiden Funktionen zur Losung des Problems gleichsetzt lasst sich immer durch Umformung folgende Form auf die das newtonsche Naherungsverfahren angewendet werden kann bestimmen f x g x 0 displaystyle f x g x 0 nbsp Gemischt goniometrische Funktion Bearbeiten Gesucht sei die positive Losung x displaystyle x nbsp der Gleichung cos x x 3 displaystyle cos x x 3 nbsp Das Problem kann umformuliert werden als cos x x 3 0 displaystyle cos x x 3 0 nbsp Gesucht werden also Nullstellen von f x cos x x 3 displaystyle f x cos x x 3 nbsp Wir haben nun f x sin x 3 x 2 displaystyle f x sin x 3x 2 nbsp Da cos x 1 displaystyle cos x leq 1 nbsp fur alle x displaystyle x nbsp gilt und x 3 gt 1 displaystyle x 3 gt 1 nbsp fur x gt 1 displaystyle x gt 1 nbsp wissen wir dass die Nullstelle zwischen 0 und 1 liegt Wir starten die Iteration mit dem Wert x 0 0 5 displaystyle x 0 0 5 nbsp x 1 x 0 f x 0 f x 0 0 5 cos 0 5 0 5 3 sin 0 5 3 0 5 2 1 112 14163710 x 2 x 1 f x 1 f x 1 0 909 672693736 x 3 0 867 263818209 x 4 0 865 477135298 x 5 0 865 474033111 x 6 0 865 474033101 x 7 0 865 474033102 displaystyle begin matrix x 1 amp amp x 0 frac f x 0 f x 0 amp amp 0 5 frac cos 0 5 0 5 3 sin 0 5 3 cdot 0 5 2 amp approx amp 1 11214163710 x 2 amp amp x 1 frac f x 1 f x 1 amp amp vdots amp approx amp 0 909672693736 x 3 amp amp vdots amp amp vdots amp approx amp 0 867263818209 x 4 amp amp vdots amp amp vdots amp approx amp 0 865477135298 x 5 amp amp vdots amp amp vdots amp approx amp 0 865474033111 x 6 amp amp vdots amp amp vdots amp approx amp 0 865474033101 x 7 amp amp vdots amp amp vdots amp approx amp 0 865474033102 end matrix nbsp Damit sind die ersten zwolf Ziffern der Nullstelle bekannt Das Newtonverfahren im Mehrdimensionalen BearbeitenDas Newtonverfahren kann auch benutzt werden um Nullstellen von mehrdimensionalen Funktionen f R n R n displaystyle f colon mathbb R n to mathbb R n nbsp zu bestimmen Ein konkreter Anwendungsfall ist die Kombination mit der Gaussschen Fehlerquadratmethode im Gauss Newton Verfahren Fur den allgemeinen Fall ist der Ausgangspunkt eine Taylorentwicklung der Funktion f displaystyle f nbsp f x h f x J x h O h 2 fur x h R n displaystyle begin aligned f mathbf x mathbf h f mathbf x J mathbf x cdot mathbf h mathcal O mathbf h 2 quad text fur quad mathbf x mathbf h in mathbb R n end aligned nbsp wobei J x f x f x x displaystyle J mathbf x f mathbf x frac partial f partial mathbf x mathbf x nbsp die Jacobimatrix also die Matrix der partiellen Ableitungen von f x displaystyle f mathbf x nbsp ist J x f i x j x i j f 1 x 1 f 1 x 2 f 1 x n f 2 x 1 f 2 x 2 f 2