www.wikidata.de-de.nina.az
Simplified Molecular Input Line Entry Specification SMILES ist ein chemischer Strukturcode bei dem die Strukturen beliebiger Molekule stark vereinfacht als ASCII Zeichenkette wiedergegeben werden Mehrere Molekul Editoren konnen SMILES Strings importieren und so zweidimensionale und dreidimensionale Modelle erzeugen Die ursprungliche SMILES Spezifikation wurde von Arthur Weininger und David Weininger in den spaten 1980ern entwickelt Insbesondere die Daylight Chemical Information Systems Inc betrieb in den folgenden Jahren die Weiterentwicklung und Modifikation der Spezifikation Im Jahr 2007 wurde schliesslich ein offener Standard namens OpenSMILES von Blue Obelisk einer chemisch orientierten Open Source Community entwickelt Da die SMILES Sprache durch die Firma Daylight kontrolliert wird und einige Probleme mit der Stereochemie und Tautomerie hat hat die IUPAC eine eigene lineare Molekulrepresentation InChI entwickelt die frei verfugbar ist Inhaltsverzeichnis 1 Beispiele 2 Konventionen 2 1 Atome 2 2 Bindungen 2 3 Verzweigungen 2 4 Getrennte Strukturen 2 5 Cyclische Strukturen 2 6 Reaktionen 3 Erweiterung 4 Siehe auch 5 Weblinks 6 EinzelnachweiseBeispiele BearbeitenSMILES Notation Gruppenformel NameC CH4 MethanCC CH3 CH3 EthanCCC CH3 CH2 CH3 PropanClc c Cl c Cl c1C O O c Cl c1Cl C7HCl5O2 Pentachlorbenzoesaure nbsp Konventionen BearbeitenAtome Bearbeiten Ein Chemisches Element wird durch sein Elementsymbol das in eckigen Klammern eingefasst ist dargestellt z B Au fur Gold Das Isotop des Elements kann spezifiziert werden indem die Massenzahl dem Elementsymbol vorangestellt wird z B 2H fur Deuterium oder 235U fur spaltbares Uran ohne diese Angabe wird das naturliche Isotopengemisch angenommen Ionen also elektrisch geladene Atome werden in der SMILES Notation durch Angabe der Ladung in den eckigen Klammern beschrieben z B Cl fur das Chlorid Ion oder Cu 2 fur das Kupfer II Ion Direkt an das Atom gebundener Wasserstoff kann ebenfalls in der Klammernotation mit angegeben werden dazu wird hinter dem Elementsymbol ein H gefolgt von der Anzahl der gebundenen Wasserstoff Atome angegeben fur ein einzelnes Wasserstoff Atom ist die Angabe der Anzahl nicht verpflichtend So konnen einfache Molekule wie zum Beispiel Chlorwasserstoff ClH oder Methan CH4 beschrieben werden Um die Notation zu vereinfachen konnen die eckigen Klammern bei Elementen der sogenannten organischen Teilmenge weggelassen werden Wenn die Klammern weggelassen werden dann werden die freien Valenzen des Atoms auf die niedrigste Standardvalenz nach der abgebildeten Tabelle mit Wasserstoffatomen aufgefullt So reicht zum Beispiel fur die Eingabe von Wasser ein O und fur Methan ein C 1 Element Standardvalenz en B 3C 4N 3 5O 2P 3 5S 2 4 6F Cl Br I 1Bindungen Bearbeiten Um anzuzeigen dass zwei Atome durch eine chemische Bindung verbunden sind wird eines der folgenden Symbole zwischen die Atome gesetzt Bindung Symbol optionalEinfachbindung jaDoppelbindung neinDreifachbindung neinVierfachbindungen neinAromatische Bindungen ja Nur OpenSMILES Bindungen in aromatischen Systemen konnen statt durch abwechselnde Doppel und Einfachbindungen durch einen Doppelpunkt symbolisiert werden Um die Schreibweise noch weiter zu vereinfachen durfen die Symbole fur Einfachbindungen und aromatische Bindungen weggelassen werden 2 Verzweigungen Bearbeiten Atome mit drei oder mehr Bindungen sind Ausgangspunkt von Verzweigungen Dabei wird nach dem entsprechenden Atom erst die Seitenkette in runden Klammern gesetzt bevor die weiteren Bindungen folgen Die Klammerebenen und damit die Verzweigungen konnen beliebig tief verschachtelt werden 3 Beispiele Strukturformel SMILES String Name nbsp CC O O Essigsaure nbsp CC C C O tert Butanol nbsp C C CO N O O O N O O O N O O GlycerintrinitratGetrennte Strukturen Bearbeiten Bei Strukturen die nicht zusammenhangen wie z B Ionenbindungen wird ein Punkt zwischen die getrennten Molekule gesetzt 4 Beispiel Natriumhydrogencarbonat Na HCO3 Na O C O O Cyclische Strukturen Bearbeiten Eines der grossten Probleme einer solchen Sprache ist es cyclische Strukturen darzustellen Bei SMILES geschieht dies dadurch dass man nach einem Atom das mit einem anderen Atom verbunden werden soll welches weiter hinten steht einen Index schreibt dies macht man auch bei dem anderen Atom und die beiden sind verbunden 5 Bei aromatischen Ringen werden die ringbildenden Atome kleingeschrieben Beispiele Strukturformel SMILES String Name nbsp c1ccccc1 Benzol nbsp Cc1c N O O cc N O O cc1 N O O Trinitrotoluol nbsp C1 CC C2C CC CC2 C1 NaphthalinReaktionen Bearbeiten Reaktionen werden in SMILES mithilfe von 2 schliessenden spitzen Klammern gt gt dargestellt Beispiel Na HCO3 HCl Na Cl H2CO3 Na O C O O HCl gt gt Na Cl O C O OWenn bei einer Reaktion ein weiterer Stoff einfliesst so schreibt man ihn zwischen die Spitzen Klammern Beispiel Na HCO3 HCl Na Cl H2CO3 Na O C O O gt HCl gt Na Cl O C O OErweiterung BearbeitenSMARTS ist eine Erweiterung von SMILES die das Suchen nach molekularen Substrukturen ermoglicht Hierzu wurde SMILES um Wildcards oder spezifische Bindungen z B aromatische anzugeben modifiziert Es gilt dass jeder gultige SMILES Ausdruck ebenfalls als SMARTS verwendet werden darf Diese Regel gilt andersherum nicht SMARTS werden vor allem fur Suchanwendungen bei chemischen Datenbanken verwendet Siehe auch BearbeitenWiswesser Line Notation WLN Chemische Formel Konstitutionsformel International Chemical IdentifierWeblinks BearbeitenSMILES Website Beschreibung der Sprache Memento vom 30 Juni 2013 im Webarchiv archive today E BABEL wechselwirkende Umwandlung der Molekule auf dem Netz mit OpenBabel SMARTS SMILES Extension Einfuhrung in SMARTS OpenSMILES SpezifikationEinzelnachweise Bearbeiten SMILES Spezifikation Abschnitt 3 1 Memento vom 13 Juli 2010 im Internet Archive SMILES Spezifikation Abschnitt 3 2 Memento vom 13 Juli 2010 im Internet Archive SMILES Spezifikation Abschnitt 3 3 Memento vom 13 Juli 2010 im Internet Archive SMILES Spezifikation Abschnitt 3 7 Memento vom 13 Juli 2010 im Internet Archive SMILES Spezifikation Abschnitt 3 4 Memento vom 13 Juli 2010 im Internet Archive Abgerufen von https de wikipedia org w index php title Simplified Molecular Input Line Entry Specification amp oldid 231222862