www.wikidata.de-de.nina.az
Der Sankoff Algorithmus nutzt dynamische Programmierung in der Genetik um simultan die drei Teilprobleme Sequenzalignment Proteinfaltung und Phylogenie zu losen Er faltet und aligniert zugleich zwei Nukleotidsequenzen so dass unter einem Energie Modell die freie Energie der Sekundarstrukturen und die Kosten der Editierungsoperationen des Alignments minimiert werden Die Laufzeit des Algorithmus ist in O n 6 displaystyle n 6 und der Speicherbedarf in O n 4 displaystyle O n 4 Eine RNA Sekundarstruktur d h eine Faltung einer RNA Sequenz Inhaltsverzeichnis 1 Fallunterscheidung 2 Komplexitat 3 Varianten 4 LiteraturFallunterscheidung BearbeitenDie Rekurrenzen des Algorithmus implementieren grundlegend folgende Fallunterscheidung 1 Ein Match von zwei Basen2 Eine Insertion einer Base3 Eine Deletion einer Base4 Ein Match von zwei Basenpaaren Seien die beiden Eingabesequenzen u v displaystyle u v nbsp mit m u n v displaystyle m u n v nbsp und 0 i lt j m 0 i lt j n displaystyle 0 leq i lt j leq m 0 leq i lt j leq n nbsp dann ist die vereinfachte Grundstruktur der Rekurrenzen M i j i j match u i v i M i 1 j i 1 j ins v i M i j i 1 j del u i M i 1 j i j pmatch u i u k v i v k M i 1 k i 1 k M k 1 j k 1 j i k j i k j displaystyle M i j i j begin Bmatrix operatorname match u i v i M i 1 j i 1 j amp operatorname ins v i M i j i 1 j amp operatorname del u i M i 1 j i j amp operatorname pmatch u i u k v i v k M i 1 k i 1 k M k 1 j k 1 j amp i leq k leq j amp i leq k leq j end Bmatrix nbsp Fall 4 stellt sicher dass bei gleichzeitiger Faltung beide Strukturen die gleiche Anzahl und Schachtelung von Hairpins bilden Komplexitat BearbeitenSei die Eingabe zwei Sequenzen u v displaystyle u v nbsp mit n max u v displaystyle n max left u v right nbsp Die Laufzeit liegt in O n 6 displaystyle O n 6 nbsp Fur alle O n 2 displaystyle O n 2 nbsp Teilworter von u displaystyle u nbsp mussen alle O n 2 displaystyle O n 2 nbsp Teilworter von v displaystyle v nbsp und in jeder Fallunterscheidung zwei Grenzen die jeweils in O n displaystyle O n nbsp variieren betrachtet werden Der Speicherbedarf ist in O n 4 displaystyle O n 4 nbsp da alle Zwischenergebnisse fur alle Teilwort Kombinationen in einer Tabelle gespeichert werden Varianten BearbeitenDa O n 6 displaystyle O n 6 nbsp Laufzeit in der Praxis problematisch ist gibt es Varianten die in der Fallunterscheidung nicht alle moglichen k displaystyle k nbsp bzw k displaystyle k nbsp betrachten sondern beispielsweise nur die Basenpaare die eine bestimmte Basenpaarwahrscheinlichkeit haben So reduziert sich dann die Laufzeit auf O n 4 c displaystyle O n 4 c nbsp Literatur BearbeitenDavid Sankoff Simultaneous Solution of the RNA Folding Alignment and Protosequence Problems In SIAM Journal on Applied Mathematics Band 45 Nr 5 Oktober 1985 S 68 82 Abgerufen von https de wikipedia org w index php title Sankoff Algorithmus amp oldid 239709630