www.wikidata.de-de.nina.az
Proteinfamilie bezeichnet eine Gruppe von strukturell ahnlichen Proteinen die zueinander in evolutionarem Zusammenhang stehen und in entsprechenden Genfamilien codiert sind Die Bezeichnungen Genfamilie und Proteinfamilie werden meist synonym verwendet je nachdem ob die Homologie in Bezug auf Genom und DNA Gene oder auf der Ebene der Genexpression Biosynthese und biologischen Funktion Proteine betrachtet wird Eine Klassifizierung von Proteinen in Familien aufgrund ihrer Aminosauresequenz und der Architektur der sequenzinternen Proteindomanen hilft beim theoretischen Verstandnis der evolutionaren Entstehung dieser Proteinfamilien und hat praktische Anwendungen in der Biotechnologie und Diagnostik Inhaltsverzeichnis 1 Grundlagen 1 1 Evolution von Proteinfamilien 1 2 Verwendung von Bezeichnungen 1 3 Bedeutung des Verstandnisses von Proteinfamilien 2 Klassifizierungssysteme 2 1 PIRSF Klassifizierung 2 1 1 Terminologie 2 1 2 Regeln 3 Beispiele von Protein Super familien 4 Weblinks 5 EinzelnachweiseGrundlagen BearbeitenEvolution von Proteinfamilien Bearbeiten Die Erweiterung einer Proteinfamilie oder die Entstehung einer neuen Familie kann auf verschiedene Weisen geschehen unterschiedliche Mechanismen schliessen sich dabei nicht gegenseitig aus Hauptartikel Homologie Genetik Entstehung homologer Gene Zwei Populationen derselben Spezies werden z B geografisch getrennt und entwickeln sich unabhangig voneinander Im Genom der Nachkommen treten Mutationen auf die bei der Expression zu veranderten Proteinen fuhren z B Veranderung der Primarstruktur was wiederum die Stabilitat und Funktion des Proteins beeinflusst In Abhangigkeit von den unterschiedlichen Lebensbedingungen werden diese Mutationen auf naturliche Weise selektioniert Dadurch etabliert sich mit der Zeit in dieser Subpopulation das Gen das fur ein Protein mit leicht veranderten Eigenschaften codiert Diese Gendrift fuhrt in einer der beiden getrennten Spezies zu einer homologen Proteinvariante dieser Proteinfamilie oder nach weiterer und langerer Veranderung zu einer orthologen Proteinfamilie mit meist immer noch ahnlicher Aminosauresequenz Entstehung paraloger Gene Eine weitere Moglichkeit ist die Veranderung eines Gens durch komplette oder partielle Genverdopplung oder Vervielfachung Dabei entsteht eine Kopie des Gens es resultiert ein Gen Cluster mit paralogen Sequenzen Da eines der Gene noch immer in der Lage ist seine ursprungliche Funktion zu erfullen kann das andere divergieren Durch weitere Mutationen konnen sich neue Funktionen in den daraus resultierenden Proteinen bilden Manche Gen und Proteinfamilien haben im Laufe der Evolution durch eine Gen oder Genomduplikation Ausdehnung erfahren z B eine Opsin Genverdoppelung auf dem X Chromosom bei Altweltaffen 1 Verwendung von Bezeichnungen Bearbeiten nbsp Proteinfamilie sehr eng gefasst Die menschliche Cyclophilin Proteinfamilie Verschiedene Familienmitglieder sind durch die leicht unterschiedlichen Strukturen ihrer Isomerase Domanen reprasentiert Die Bezeichnung Proteinfamilie wird in der Literatur nicht einheitlich sondern kontextabhangig verwendet Proteinfamilie kann mehrere sehr grosse Gruppen von Proteinen mit einem niedrigst moglichen Niveau mathematisch nachweisbarer Sequenzhomologie und damit verbunden sehr unterschiedlichen biologischen Funktionen umfassen oder aber auf sehr eng gefasste Gruppen von Proteinen bezogen werden die miteinander verglichen fast identische Sequenzen dreidimensionale Strukturen und Funktionen besitzen Als Margaret Oakley Dayhoff Mitte der 1970er Jahre die Systematik der Proteinsuperfamilie engl protein superfamily einfuhrte 2 3 4 waren nur 493 Proteinsequenzen bekannt Es waren meist kleine Proteine mit nur einer Proteindomane wie Myoglobin Hamoglobin und Cytochrom c die von Dayhoff und Mitarbeitern in 116 Superfamilien eingeteilt wurden Die Bezeichnungen Superfamilie gt Familie gt Subfamilie erlaubten eine Abstufung und es wurden zahlenbezogene Definitionen dafur angegeben 5 6 Parallel wurden uber die Jahre auch andere Begriffe wie Proteinklasse protein class Proteingruppe protein group und Proteinunterfamilie gepragt und verwendet Auch diese Bezeichnungen werden je nach dem Zusammenhang mehrdeutig verwendet Bedeutung des Verstandnisses von Proteinfamilien Bearbeiten Die Gesamtzahl der direkt oder uber die Gene indirekt sequenzierten Proteine von Lebewesen und Viren steigt stetig an und erfordert eine auf den biologischen Gegebenheiten beruhende sinnvolle Strukturierung und Klassifizierung Einige Wissenschaftler geben die Zahl von Proteinfamilien mit mindestens 60 000 an 7 Einerseits besteht ein theoretisches Interesse am immer besseren Verstandnis wie sich verschiedene Gene und die Funktionen der so codierten Proteine im Lauf der Evolution verandert und entwickelt haben andererseits gibt es ganz konkrete Anwendungen bei denen die Kenntnis der Zusammenhange zwischen Proteinfamilien und Domanenarchitektur eine wichtige Rolle spielen Beispiele sind die enzymatische Synthese in der industriellen Biotechnologie die Entwicklung von neuen Impfstoffen aus massgeschneiderten rekombinanten Proteinen oder der Bereich der medizinischen Analytik Proteomik Sequenzvergleiche durch phylogenetische und Clusteranalyse erlauben eine Zuordnung von Proteinen in Familien und die Zuordnung dieser in ubergeordnete Superfamilien Aus diesen Zuordnungen lassen sich theoretische Erwagungen bei neu entdeckten Proteinen bezuglich ihrer potentiellen Sekundar und Tertiarstruktur machen und sie eroffnen mogliche Ansatze zur Aufklarung von noch unbekannten Funktionen Klassifizierungssysteme BearbeitenEs gibt mehrere Systeme fur die Klassifizierung von Proteinfamilien die sich im Ansatz und der Systematik unterscheiden Eines dieser Systeme wird im Detail beschrieben PIRSF Klassifizierung Bearbeiten Die Datenbank Universal Protein Resource UniProt die aus dem 2002 erfolgten Zusammenschluss der Datenbanken TrEMBL des European Bioinformatics Institute EBI Swiss Prot des Swiss Institute of Bioinformatics SIB und der Protein Information Resource PIR des Georgetown University Medical Center GUMC entstand vertritt das PIR Superfamily Klassifizierungssystem PIRSF Terminologie Bearbeiten Anfanglich war die auf den Arbeiten von Dayhoff basierende PIR Klassifizierung in Superfamilie Familie und Subfamilie linear hierarchisch strukturiert Ein Protein konnte und durfte nur einer einzigen Proteinfamilie zugeordnet werden und diese nur einer einzigen Superfamilie Dieses System musste revidiert werden als mehr und mehr Primarstrukturen durch die direkte Sequenzierung von gereinigten Proteinen aber vor allem durch das Ablesen der in sequenzierten Genen codierten Proteine bekannt wurden Man erkannte dass es Proteine gab die strukturell eher einfach aufgebaut waren und andere die uber sehr komplexe Strukturen verfugten Homoomorphe Proteine engl homeomorphic proteins sind Proteine die untereinander topologisch aquivalent sind das heisst sie sind vom N Terminus bis zum C Terminus homolog und weisen dieselbe Art ahnliche 8 Anzahl und Anordnung von Domanen auch Domanenstruktur oder Domanenarchitektur genannt auf konnen aber unterschiedliche Sequenzlange haben Domanen Proteine engl domain proteins sind aufgrund von Genfusionen deletionen und oder insertionen komplexer aufgebaut und enthalten verschiedene Domanen oder Domanen in unterschiedlich angelegter Anordnung die sonst nur bei sehr unterschiedlichen homoomorphen Proteinen gefunden werden Ab 1993 unterschied PIR deshalb zwischen homoomorphen Superfamilien engl homeomorphic superfamilies und Domanen Superfamilien engl domain superfamilies Regeln Bearbeiten Das PIRSF System basiert auf folgenden Regeln Das Einpflegen eines neuen Proteins in eine Superfamilie Familie oder Subfamilie wird nicht automatisch sondern manuell durchgefuhrt Ergebnisse maschineller Sequenzalignments und Clusteranalyse werden dabei hinzugezogen Jeder Eintrag wird so ausfuhrlich wie moglich annotiert und andere Klassifizierungsschemata sowie Eintrage aus anderen ahnlichen Datenbanken werden erwahnt Damit sowohl biochemische als auch biologische Funktionen eines Proteins klar dargelegt werden und auch um Proteine mit weniger gut oder nicht definierten Domanen klassifizieren zu konnen beruht das PIRSF System auf der Klassifizierung ganzer Proteine und nicht auf der Klassifizierung einzelner oder isolierter Domanen Eine hierarchische Struktur kann Verschiebungen von Domanen engl domain shuffling die sich im Verlauf der Evolution ereignet haben nicht darstellen Daher ist das PIRSF System ein netzwerkartiges Klassifizierungssystem das auf der evolutionaren Verwandtschaft ganzer Proteine beruht Primare Netzwerkknoten primary nodes parent node sind die homoomorphen Proteinfamilien die Proteine enthalten die sowohl homolog ortholog oder paralog d h die einen gemeinsamen Vorlaufer Proteinahnen Urprotein haben als auch homoomorph sind d h uber die gesamte Lange der Primarstruktur Ahnlichkeit und eine gleichartige Anordnung der Domane n besitzen es werden definierte Parameter fur die mathematischen Algorithmen zur Bestimmung von Ahnlichkeit durch Sequenzalignment verwendet Oberhalb dieser Knoten der homoomorphen Proteinfamilien sind die Knoten von weiteren Domanen Superfamilien angeordnet Diese evolutionar weiter voneinander entfernten Superfamilien und auch die noch keiner Familie zugeordnete Einzelproteine beruhen auf Domanen die den darunter liegenden Superfamilien gemeinsamen sind Eine unterhalb liegende homoomorphen Proteinfamilie kann muss aber nicht mehreren oberhalb liegenden Domanen Superfamilien zugeordnet sein Diese oberhalb angeordneten Superfamilien konnen homoomorphe Proteinsuperfamilien sein aber es ist wahrscheinlicher dass es Domanen Superfamilien sind wenn sich die Proteinbereiche die die Domanen umfassen nicht uber die ganze Lange des Proteins erstrecken Unterhalb der homoomorphen Proteinfamilien befinden sich Knoten von Subfamilien engl child subfamily nodes homologe und homoomorphe Gruppen engl clusters von Proteinen mit funktionaler Spezialisierung und oder einer Variation der Domanenarchitektur innerhalb der Proteinfamilie Jede Subfamilie hat nur einen ubergeordneten Netzwerkknoten parent node Beispiele von Protein Super familien BearbeitenIn der Folge findet sich eine unvollstandige Auflistung von Proteinfamilien und superfamilien G Protein Heterotrimeres G Protein Kleine GTPase G Protein gekoppelter Rezeptor Globulin Immunglobulin Haupthistokompatibilitatskomplex MHC Histon Histon H1 Histon H1F Histon H1H1 Histon H2A Histon H2AF Histon H2A1 Histon H2A2 Histon H2B Histon H2BF Histon H2B1 Histon H2B2 Histon H3 Histon H3A1 Histon H3A2 Histon H3A3 Histon H4 Histon H41 Histon H44 Hitzeschockprotein Kleine Hitzeschockproteine Hsp40 Hsp60 Hsp70 Hsp90 Motorprotein Dynein Kinesin Myosin Proteinkinase Histidinkinase Rezeptor Tyrosinkinase SLC TransporterWeblinks BearbeitenPfam Datenbank von Proteinfamilien Alignments und HMMs engl PROSITE Databank fur Proteindomanen Proteinfamilien und functional sites engl PIRSF SuperFamily Klassifikationssystem engl PASS2 Proteinalignment in strukturelle Superfamilien engl SUPERFAMILY HMM Bibliothek zur Darstellung von Superfamilien und Datenbank von Superfamilien und Familien Annotierungen aller bisher komplett sequenzierten Organismen engl Einzelnachweise Bearbeiten Timothy H Goldsmith Vogel sehen die Welt bunter M O Dayhoff Computer analysis of protein sequences Fed Proc 33 2314 2316 1974 M O Dayhoff J P McLaughlin W C Barker und L T Hunt Evolution of sequences within protein superfamilies Naturwissenschaften 62 154 161 1975 M O Dayhoff The origin and evolution of protein superfamilies Fed Proc 35 2132 2138 1976 Jahreshefte der Gesellschaft fur Naturkunde in Wurttemberg Bande 130 132 1975 Seite 18 Proteinunterfamilie mit weniger als 20 Differenzen Proteinfamilie mit weniger als 50 Differenzen Proteingrossfamilie hierzu gehoren alle Proteine deren Ahnlichkeit mit einer Wahrscheinlichkeit von uber 99 9 nicht zufallig ist wobei die Zahl der ubereinstimmenden Aminosauren auch kleiner als 50 sein kann Detlev Ganten und Klaus Ruckpaul Grundlagen der Molekularen Medizin Springer 2007 Seite xxxi Proteinfamilie Gruppe von Proteinen mit mindestens 50 Sequenzidentitat Proteinsuperfamilie Gruppe von Proteinen mit signifikanter Ahnlichkeit untereinander aber weniger als 50 Sequenzidentitat V Kunin I Cases A J Enrigh V de Lorenzo und C A Ouzounis Myriads of protein families and still counting Genome Biology 4 401 2003 Memento des Originals vom 3 Oktober 2012 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot genomebiology com In der Domanenarchitektur konnen leichte Variationen auftreten z B Wiederholung derselben Domane oder bei Hilfsdomanen engl auxiliary domains die oft relativ leicht erworben verschoben ersetzt oder wieder verloren werden konnen Abgerufen von https de wikipedia org w index php title Proteinfamilie amp oldid 229301234