www.wikidata.de-de.nina.az
Eine chemische Datenbank ist eine Datenbank zur Speicherung von Informationen uber chemische Verbindungen Dabei kann es sich um Strukturinformationen Kristall oder Molekulstruktur physikalische und thermodynamische Eigenschaften Spektren Reaktionen und Synthesen handeln Inhaltsverzeichnis 1 Arten von chemischen Datenbanken 1 1 Chemische Strukturen 1 2 Literaturdatenbank 1 3 Kristallographische Datenbank 1 4 NMR Spektren Datenbank 1 5 Datenbanken von Reaktionen 1 6 Thermophysikalische Datenbank 2 Chemische Strukturdarstellung 3 Suche 3 1 Substruktursuche 3 2 3D Konformation 3 3 Deskriptoren 3 4 Chemische Ahnlichkeit 3 5 Registrierung 4 Werkzeuge 5 Siehe auch 6 Weblinks 6 1 Datenbanken mit chemischen Strukturen 6 2 Datenbanken der chemischen Namen 7 Anmerkungen und LiteraturArten von chemischen Datenbanken BearbeitenChemische Strukturen Bearbeiten Chemische Strukturen werden in der Regel als Skelettformeln dargestellt Mit ublichen Computerprogrammen werden sie als zweidimensionale Pixel oder Vektorgrafiken mit Buchstaben fur Atome und Strichen fur Bindungen gespeichert Diese Dateitypen sind leicht anzuzeigen beziehungsweise zu rendern und ideal fur das Verstandnis durch einen Chemiker geeignet Fur den computergestutzten Einsatz sind sie bis auf ihre leichte Anzeigbarkeit ganzlich ungeeignet da sie sowohl speicherineffizient als auch praktisch nicht durchsuchbar sind In chemischen Datenbanken erfolgt die Darstellung kleiner Molekule oder Liganden im Wirkstoffdesign Prozess in der Regel in Form von Listen einer Liste mit den Atomen und einer mit den Bindungen zwischen den Atomen Grosse Molekule weisen dagegen haufig nur wenige Strukturgrundbausteine Monomere auf In einer kompakteren Darstellungsform kann fur solche Molekule die Sequenz dieser Monomere angegeben werden etwa fur Proteine die Aminosaure Sequenz Grosse Datenbanken fur chemische Strukturen werden aufgebaut um die Speicherung und Abruf von Informationen uber Millionen von Molekulen und ihren physikalischen Eigenschaften oder ihrer Verbindungen zu handhaben Literaturdatenbank Bearbeiten Chemische Literaturdatenbanken verbinden Strukturen und andere chemische Informationen mit relevanten Referenzen wie wissenschaftlichen Arbeiten oder Patenten Beispiele sind STN SciFinder und Reaxys Kristallographische Datenbank Bearbeiten Kristallographische Datenbanken verwalten Kristallstrukturdaten Typische Beispiele sind die Protein Data Bank und die Cambridge Structural Database NMR Spektren Datenbank Bearbeiten NMR Spektren Datenbanken korrelieren chemische Strukturen mit NMR Daten Reine NMR Datenbanken sind selten die meisten Datenbanken kombinieren mehrere spektroskopische Methoden etwa auch FTIR und MS Datenbanken von Reaktionen Bearbeiten Reaktionsdatenbanken enthalten Informationen uber Produkte Edukte und Mechanismen von Reaktionen Wahrend chemische Datenbanken nur langlebige Verbindungen erfassen speichern Reaktionsdatenbanken auch instabile Intermediate Thermophysikalische Datenbank Bearbeiten Thermophysikalische Datenbanken speichern Informationen uber Phasengleichgewichte Dampf Flussigkeit Gleichgewichte Loslichkeit von Gasen oder Feststoffen in Flussigkeiten Mischungswarmen Verdampfungs und Schmelzenthalpien Kalorische Daten wie Warmekapazitaten Standardbildungsenthalpien und Verbrennungsenthalpien Transporteigenschaften wie Viskositat und Warmeleitfahigkeit Chemische Strukturdarstellung BearbeitenEs gibt zwei grundlegende Techniken fur die Darstellung chemischer Strukturen in digitalen Datenbanken Eine Darstellungsform ist die graphentheoretische wobei Atomen als Knoten und Bindungen als Kanten dargestellt werden Hierzu werden Verbindungstabellen Adjazenzmatrizen und andere Formen von Listen genutzt Beispiele sind MDL Molfile PDB und CML Die andere ist eine Notation als lineare Zeichenfolge auf Basis der Tiefen oder Breitensuche Beispiele sind SMILES SMARTS SLN WLN und InChI Diese Ansatze wurden gegenuber den grundlegenden graphentheoretischen Konzepten verfeinert um besondere Aspekte chemischer Verbindungen darstellen zu konnen darunter stereochemische Unterschiede und besondere Bindungsarten die vor allem in metallorganischen Verbindungen vorkommen Hauptvorteile der computerlesbaren Darstellung sind der verringerte Speicherplatzbedarf sowie die flexible Durchsuchbarkeit Suche BearbeitenSubstruktursuche Bearbeiten Datenbanken konnen nach Grund und Teilstrukturen Bestandteilen von IUPAC Namen einschrankenden Eigenschaften durchsucht werden Insbesondere die Moglichkeit nach einer Substruktur zu suchen grenzt chemische Datenbanken von Allzweckdatenbanken ab Substruktursuchen werden in der internen graphentheoretischen Darstellungsform als Suchen nach Subgraphisomorphismen Monomorphismus durchgefuhrt Die Suchalgorithmen weisen zeitliche Komplexitaten von O N3 oder O N4 auf N ist die Anzahl der beteiligten Atome und sind damit im Vergleich zu anderen Suchalgorithmen sehr rechenintensiv Die Suche der Komponenten heisst Atom fur Atom Suche ABAS In dieser Suche werden Atome und Bindungen mit dem Zielmolekul verglichen Die ABAS nutzt in der Regel den Ullman Algorithmus 1 oder Variationen davon etwa SMSD 2 Beschleunigungen der Suche werden durch Aufteilungen erreicht Dazu wird ein Index angelegt indem vorberechnete Daten gespeichert werden die dann bei Suchanfragen genutzt werden konnen Typischerweise sind dies Bitstrings die die An oder Abwesenheit bestimmter Molekulfragmente darstellen Bei der eigentlichen Suche werden dann nur Verbindungen betrachtet die uber die vorgerechneten Fragmente verfugen die restlichen mussen bei der Suche gar nicht berucksichtigt werden Diese Eliminierung wird als Screening bezeichnet Die Bit Strings die fur diese Anwendungen verwendet werden werden Struktur Schlussel genannt Die Leistung solcher Schlussel hangt von der Wahl der Fragmente fur die Konstruktion der Schlussel und der Wahrscheinlichkeit ihres Auftretens in den einzelnen Molekulen ab Eine andere Art von Schlussel nutzt Hash Codes um Fragmente abzuleiten Diese werden als Fingerabdrucke bezeichnet ein Begriff der manchmal auch fur Struktur Schlussel verwendet wird Die Grosse des Speichers der benotigt wird um Struktur Schlussel und Fingerabdrucke zu speichern kann durch Faltung reduziert werden Hierbei werden Teile des Schlussels mit bitweisen Operationen kombiniert wodurch sich die Gesamtlange verkurzt 3 3D Konformation Bearbeiten Die Suche nach passenden 3D Konformationen von Molekulen unter Angabe raumlicher Einschrankungen ist ein Merkmal das besonders in der Wirkstoffentwicklung wichtig ist Suchen dieser Art sind kompliziert sie benotigen in der Regel viel Rechenzeit und liefern dabei nur ungefahre Ergebnisse Suchalgorithmen basieren beispielsweise auf BCUTs Eigenwerte von Adjazenzmatrizen Darstellung als spezielle Funktionen Tragheitsmomenten beziehungsweise Tragheitstensoren Raytracing Histogrammen Abstandshistogrammen und Multipol Formen 4 5 6 7 8 Deskriptoren Bearbeiten Alle Eigenschaften von Molekulen die nicht direkt aus ihrer Struktur hervorgehen werden als Deskriptoren bezeichnet Dies konnen beispielsweise physikalische Siede und Schmelztemperatur physikalisch chemische thermodynamische Parameter wie die Gibbs Energie Lipophilie Aciditat Basizitat oder pharmakologische Eigenschaften sein Weitere Deskriptoren sind die mehr oder weniger standardisierten Benennungen der Molekule entsprechend den verschiedenen Nomenklaturen die teilweise auch mehrdeutig sein konnen Der IUPAC Name ist in der Regel ein guter Kompromiss fur die Darstellung einer Molekulstruktur da er eine sowohl fur Menschen lesbare als auch eine eindeutige und damit von Computern verarbeitbarer Zeichenfolge darstellt IUPAC Namen sind jedoch fur grossere Molekule unhandlich Trivialname Homonyme und Synonyme sind dagegen eine schlechte Wahl fur die Definition eines Datenbank Schlussels Wahrend physikalisch chemische Deskriptoren wie die molare Masse und die Ladung in geringerem Masse auch Partialladungen und Loslichkeiten direkt auf der Struktur des Molekul basieren und deshalb berechnet werden konnen konnen pharmakologische Deskriptoren nur indirekt mit einbezogen werden multivariate Statistik oder experimentelle Ergebnisse aus Screenings und Bioassays und deshalb nicht fur die Molekuldarstellung verwendet werden Chemische Ahnlichkeit Bearbeiten Chemische Ahnlichkeit oder molekulare Ahnlichkeit bezieht sich auf strukturelle oder funktionelle Ahnlichkeit chemischer Elemente Molekule oder Verbindungen Es gibt keine einheitliche Definition der molekularen Ahnlichkeit aber das Konzept kann je nach Anwendung wie folgt definiert werden und wird oft als das Inverse eines Entfernungsmasses im Deskriptor Raum beschrieben Zwei Molekule konnten als eher ahnlich bezeichnet werden wenn z B die Differenz ihrer molaren Massen geringer ist als im Vergleich zu anderen Molekulen Eine Vielzahl verschiedener Grossen Dipolmoment Saure und Basenkonstanten konnen zu einem multivarianten Abstandsmass zusammengefuhrt werden Entfernungsmasse werden oft in euklidische oder nichteuklidische Metriken klassifiziert je nachdem ob die Dreiecksungleichung bestand hat Die Suche nach maximalen gemeinsamen Subgraphen maximum common subgraph MCS basierte Substruktursuche 9 ist ein weiteres haufig eingesetztes Distanzmass Sie wird ausserdem verwendet um in Molekulen gemeinsame Teilstrukturen zu finden 10 In chemischen Datenbanken werden Gruppen von ahnlichen Molekulen auf Ahnlichkeiten hin geclustert Sowohl hierarchische als auch nicht hierarchische Clustering Ansatze konnen auf chemische Einheiten mit mehreren Attributen angewendet werden Diese Attribute oder molekulare Eigenschaften konnen entweder empirisch oder rechnerisch bestimmt werden Einer der beliebtesten Clustering Ansatze ist der Jarvis Patrick Algorithmus 11 In pharmakologisch ausgerichteten chemischen Repositories wird die Ahnlichkeit in der Regel in Bezug auf die biologische Wirkung der Verbindungen definiert ADME tox die wiederum halbautomatisch aus ahnlichen Kombinationen von physikalisch chemischen Deskriptoren QSAR Methoden ermittelt werden konnen Registrierung Bearbeiten Fur gewisse Anwendungszwecke beispielsweise die Indexierung von Patent und Industrie Datenbanken mussen die erfassten Informationen in einer garantiert eindeutigen Darstellung gespeichert werden Dies gelingt durch die Erzeugung von einzigartigen kanonischen Zeichenketten etwa SMILES als Reprasentanten der chemischen Verbindung Einige Registriersysteme wie das CAS System nutzen zu diesem Zweck Hashfunktionen Ein wesentlicher Unterschied zwischen einer Registrierung und einer einfachen chemischen Datenbank ist die Fahigkeit genau darzustellen was bekannt unbekannt oder teilweise bekannt ist Zum Beispiel konnte eine chemische Datenbank ein Molekul mit spezifizierter Stereochemie speichern wahrend ein chemisches Registriersystem den Registrar auffordert anzugeben ob die Stereo Konfiguration unbekannt ist oder ob es sich um ein Racemat oder eine bestimmte bekannte Mischung ist Registriersysteme konnen auch Informationen aufbereiten um die Registrierung von Stoffen zu vermeiden die im Vergleich zu bereits registrierten Verbindungen nur triviale chemische Unterschiede aufweisen beispielsweise andere Halogenatome Werkzeuge BearbeitenDie rechnerischen Darstellungen sind in der Regel grafische Darstellungen der Daten entsprechend der Eingaben des Registrars Die Dateneingabe wird auch durch die Verwendung von chemischen Struktureditoren vereinfacht Diese Editoren wandeln die internen Daten in grafischen Darstellungen der Molekule oder Reaktionen um Es gibt auch zahlreiche Algorithmen fur die Umwandlung von verschiedenen Formaten der Reprasentation Ein Open Source Programm fur die Konvertierung ist Openbabel Diese Suche und Konvertierungsalgorithmen sind entweder innerhalb der Datenbank System selbst implementiert oder als externe Komponente Cartridge an Standard Relationalen Datenbanksystemen angepasst implementiert und nachtraglich installiert Sowohl Oracle als auch PostgreSQL basierte Systeme nutzen Cartridge Technologie die eigene Benutzer Datentypen z B CTAB als Struktur Datentyp erlauben Diese externen Komponente erlauben es dem Benutzer SQL Abfragen mit chemischen Suchkriterien zu formulieren z B eine Anfrage fur Aufzeichnungen mit einem Phenylring in ihrer Struktur als einem Smiles Zeichenkette in einer SMILESCOL Spalte dargestellt suchen konnte SELECT FROM CHEMTABLE WHERE SMILESCOL CONTAINS c1ccccc1 Algorithmen fur die Umwandlung von IUPAC Namen in strukturieren Darstellungen und umgekehrt sind auch fur die verwendete Extraktion struktureller Informationen aus dem Text moglich Es gibt jedoch Schwierigkeiten wegen der Existenz mehrerer IUPAC Dialekte Als einzigartiger Standard hat sich hier InChI etabliert Siehe auch BearbeitenBiologische Datenbanken Beilstein Datenbank Beilsteins Handbuch der Organischen Chemie ist eine Datenbank fur organische Chemie eine der grossten Faktendatenbanken der Welt und ein Standardwerk der chemischen Literatur Dortmund Datenbank kurz DDB ist eine Sammlung thermophysikalischer und thermodynamischer Daten reiner Stoffe und Stoffgemische ChEBI ein freies Lexikon uber molekulare Entitaten ChemSpider ist eine freie Datenbank chemischer Verbindungen DrugBank eine Datenbank die Medikamente d h chemischen pharmakologischen und pharmazeutischen Daten mit umfassenden Target d h Sequenz Struktur Weg Informationen kombiniert PubChem SPRESI DatenbankWeblinks BearbeitenDatenbanken mit chemischen Strukturen Bearbeiten mcule database kostenlose Datenbank fur virtuelles Screening und Bestellung Synthesis references database Synthese Referenz Datenbank eChemPortal ein globales Portal der OECD mit Informationen uber chemische Stoffe NLM ChemIDplus biomedizinische Chemie durchsuchbar nach Name und Struktur Organic synthesis database Organische Synthese Datenbank ZINC eine freie Datenbank fur das virtuelle Screening ChemSpider Freier Zugang zu gt 20 Millionen chemischen Strukturen Stoffdaten und systematischen Identifikatoren MMsINC eine kostenlose Web orientierte Datenbank kommerziell erhaltlicher Verbindungen fur virtuelles Screening und Chemoinformatik Anwendungen ChemIndustry eine freie Datenbank abgeleiteter PubChem Daten NCI CADD Chemical Structure Lookup Service Verzeichnis in welchen Datenbanken eine Struktur auftritt derzeit gt 70 Millionen indizierte chemische Strukturen ChEBI freien chemischen Substanz Registrierung fur biologisch relevante Molekule Chemonaut Chemonaut ist die weltweit umfassendste Quelle fur physikalisch verfugbare kommerzielle Verbindungen chemicalize org Kostenlose webbasierte Datenbank von ChemAxon bietet Ahnlichkeit Substruktur oder exakte Struktur sucht mit Web und Dokument pdf Microsoft Dokumente usw Parsing FunktionenDatenbanken der chemischen Namen Bearbeiten ChemSub Online kostenloses Web Portal und Informationssystem uber chemische Stoffe Stoffnamen in acht Sprachen EuroChem Online Datenbank die freie Chemikalien DatenbankAnmerkungen und Literatur Bearbeiten Julian R Ullmann An algorithm for subgraph isomorphism In Journal of the ACM 23 Jahrgang Nr 1 1976 S 31 42 doi 10 1145 321921 321925 S A Rahman M Bashton G L Holliday R Schrader J M Thornton Small Molecule Subgraph Detector SMSD toolkit In Journal of Cheminformatics 1 Jahrgang 2000 S 12 doi 10 1186 1758 2946 1 12 Maxwell D Cummings Alan C Maxwell Renee L DesJarlais Processing of Small Molecule Databases for Automated Docking In Medicinal Chemistry 3 Jahrgang Nr 1 2007 S 107 113 R S Pearlman K M Smith Metric Validation and the Receptor Relevant Subspace Concept In J Chem Inf Comput Sci 39 Jahrgang 1999 S 28 35 Hung Lin Jr Timothy Clark An analytical variable resolution complete description of static molecules and their intermolecular binding properties In JCIM 45 Jahrgang Nr 4 2005 S 1010 1016 P J Meek Z Liu L Tian C J Wang W J Welsh R J Zauhar Shape Signatures speeding up computer aided drug discovery In DDT 2006 19 20 Jahrgang 2006 S 895 904 J A Grant M A Gallardo B T Pickup A fast method of molecular shape comparison A simple application of a Gaussian description of molecular shape In JCIC 17 Jahrgang Nr 14 1996 S 1653 1666 P J Ballester W G Richards Ultrafast shape recognition for similarity search in molecular databases In Proceedings of the Royal Society A 463 Jahrgang 2007 S 1307 1321 S A Rahman M Bashton G L Holliday R Schrader and J M Thornton Small Molecule Subgraph Detector SMSD toolkit Journal of Cheminformatics 2009 1 12 doi 10 1186 1758 2946 1 12 S Asad Rahman M Bashton G L Holliday R Schrader J M Thornton Small Molecule Subgraph Detector SMSD Toolkit In Journal of Cheminformatics 1 Jahrgang 2009 S 12 doi 10 1186 1758 2946 1 12 ebi ac uk Memento des Originals vom 28 Januar 2020 im Internet Archive abgerufen am 5 Oktober 2013 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www ebi ac uk Darko Butina Unsupervised Data Base Clustering Based on Daylight s Fingerprint and Tanimoto Similarity A Fast and Automated Way To Cluster Small and Large Data Sets In Chem Inf Comput Sci 39 Jahrgang 1999 S 747 750 Abgerufen von https de wikipedia org w index php title Chemische Datenbank amp oldid 234852559