www.wikidata.de-de.nina.az
Das Dateiformat CSV steht fur englisch Comma separated values seltener Character separated values 1 und beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten Die Dateinamenserweiterung lautet csv CSVDateiendung csvMIME Type text csvEin allgemeiner Standard fur das Dateiformat CSV existiert nicht jedoch wird es im RFC 4180 2 grundlegend beschrieben Die zu verwendende Zeichenkodierung ist ebenso wenig festgelegt 7 Bit ASCII Code gilt weithin als der kleinste gemeinsame Nenner In CSV Dateien konnen Tabellen oder eine Liste unterschiedlich langer Listen abgebildet werden Als Alternative zum CSV Format wurde fruher auch das Simple Data Format SDF verwendet Kompliziertere beispielsweise geschachtelte Datenstrukturen konnen durch zusatzliche Regeln oder in verketteten CSV Dateien gespeichert werden Um sie in einer Datei abzuspeichern eignen sich jedoch andere Formate wie JSON XML oder EDIFACT besser Inhaltsverzeichnis 1 Dateiaufbau 2 Formatierung der Datenfelder 3 Software 4 Anwendungen 5 Beispiel 6 Normen und Standards 7 EinzelnachweiseDateiaufbau BearbeitenInnerhalb der Textdatei haben einige Zeichen eine Sonderfunktion zur Strukturierung der Daten Ein Zeichen wird zur Trennung von Datensatzen benutzt Dies ist in der Regel der Zeilenumbruch des dateierzeugenden Betriebssystems bei dem Betriebssystem Windows sind es in der Praxis oft tatsachlich zwei Zeichen Ein Zeichen wird zur Trennung von Datenfeldern Spalten innerhalb der Datensatze benutzt Allgemein wird dafur das Komma eingesetzt Abhangig von beteiligter Software und Benutzereinstellungen sind auch Semikolon Doppelpunkt Tabulatorzeichen Leerzeichen oder andere Zeichen ublich Haufig wird zusatzlich ein Feldbegrenzerzeichen auch Textbegrenzungszeichen normalerweise das Anfuhrungszeichen benutzt das die Daten umschliesst wenn es selbst oder die anderen beiden in dieser Liste genannten Zeichen in den Felddaten vorkommen Wenn der Feldbegrenzer in den Daten enthalten ist wird er zudem bei der Ausgabe verdoppelt siehe Maskierungszeichen Der erste Datensatz kann ein Kopfdatensatz sein der die Spaltennamen definiert Jeder Datensatz sollte laut RFC 4180 3 Absatz 2 Punkt 4 die gleiche Anzahl Spalten enthalten dies wird aber nicht immer eingehalten Wird fur die Trennung der Datenfelder das Tabulatorzeichen verwendet wird das Dateiformat auch als TSV englisch Tab separated values bezeichnet Es hat den Vorteil dass Tabulatorzeichen in der Regel nicht in den Nutzdaten vorkommen Kommen auch keine Zeilenumbruche darin vor erubrigt sich die Verwendung eines Feldbegrenzers TSV kommt oft beim Austausch von Daten zwischen Tabellenkalkulations und sonstigen Programmen uber die Zwischenablage zum Einsatz Formatierung der Datenfelder BearbeitenDie Formatierung der Daten selbst ist nicht festgelegt Das bedeutet dass die verwendeten Formate zwischen den beteiligten Benutzern abgesprochen werden mussen Besonders davon betroffen sind Datums und Zeitangaben Die Reihenfolge der Einzelangaben Jahr Monat Tag Stunde Minute Sekunde kann nicht immer eindeutig erkannt werden Erschwerend kommt dazu dass insbesondere bei Datumsangaben national unterschiedliche Trennzeichen genutzt werden Die kleinste Hurde in diesem Fall ist dass die Zahlenwerte mit und ohne fuhrende Null vorkommen Beispiele Ist 04 03 02 der 4 Marz 2002 der 3 April 2002 der 2 Marz 2004 oder ein ganz anderer Wert Entspricht 8 09 morgens neun Minuten nach acht 20 Uhr 09 oder ist es eine Dauer von 8 Minuten und 9 Sekunden Texte Im Gegensatz zu XML sieht CSV keinen Vermerk des benutzten Zeichensatzes innerhalb der Datei vor Die verwendete Zeichencodierung sollte zwischen allen Beteiligten im Vorfeld festgelegt werden Zahlenwerte Nach der ursprunglichen Vorgabe fur das CSV Datenformat konnen Zahlenfelder mit fester Mindestbreite verwendet werden Dann werden Zahlenwerte mit fuhrenden Nullen erganzt um die Mindestbreite zu erhalten In verschiedenen Landern haben sich unterschiedliche Dezimal und Tausendertrennzeichen etabliert Uber Landergrenzen hinweg konnen diese Zeichen sogar gegensatzlich benutzt werden Manchmal wird kein Tausendertrennzeichen eingesetzt Die Formatfulle von Wahrungsangaben ist unuberschaubar Leerfeld Der Feldinhalt wird manchmal als leerer Inhalt und manchmal als einzelnes Anfuhrungszeichen interpretiert Software BearbeitenCSV Dateien konnen mit jedem Texteditor oder mit einem speziellen Programm bearbeitet werden Tabellenkalkulationsprogramme und Datenbanksysteme wie z B Oracle oder MySQL konnen CSV Dateien ublicherweise einlesen und auch exportieren wobei Einstellungen wie Codierung Trennzeichen etwaige Textbegrenzungszeichen und Spaltenuberschriften in der Regel nicht vorgenommen werden konnen Um zwei CSV Dateien miteinander zu vergleichen kann csvdiff verwendet werden Batch Werkzeugkasten zur Bearbeitung sind csvkit und csvfix Mit PHP kann eine CSV Datei mit der Funktion fgetcsv eingelesen werden 4 tarql stellt ein SPARQL Interface zur Verfugung Anwendungen BearbeitenDas CSV Dateiformat wird oft benutzt um Daten zwischen unterschiedlichen Computerprogrammen auszutauschen beispielsweise Datenbanktabellen Die Passwortdatei etc passwd der Unix Benutzerverwaltung ist eine CSV Datei mit dem Trennzeichen Beispiel BearbeitenDer folgende Quelltext einer CSV Datei mit dem Komma als Feldtrennzeichen und Zeilenumbruch CR LF als Datensatz Trennzeichen sowie mit Spaltenuberschriften in der ersten Zeile Stunde Montag Dienstag Mittwoch Donnerstag Freitag 1 Mathematik Deutsch Englisch Erdkunde Politik 2 Sport Deutsch Englisch Sport Geschichte 3 Sport Religion ev kath Kunst Kunst reprasentiert die folgende Tabelle Stunde Montag Dienstag Mittwoch Donnerstag Freitag1 Mathematik Deutsch Englisch Erdkunde Politik2 Sport Deutsch Englisch Sport Geschichte3 Sport Religion ev kath Kunst KunstIn diesem Beispiel werden die Anfuhrungszeichen verwendet um das Komma zwischen ev und kath in der letzten Zeile als Text zu kennzeichnen Das dritte Element dieser Zeile lautet also Religion ev kath Ausserdem werden alle ASCII Zeichen in Form des 8 Bit Zeichensatzes ISO 8859 1 verarbeitet Normen und Standards BearbeitenDas Dateiformat CSV ist auch als Request for Comments RFC spezifiziert RFC 4180 Common Format and MIME Type for Comma Separated Values CSV Files Oktober 2005 englisch RFC 7111 URI Fragment Identifiers for the text csv Media Type Januar 2014 englisch Einzelnachweise Bearbeiten Dirk Louis Peter Muller Das Java 6 Codebook Pearson Education 2007 ISBN 978 3 8273 2465 8 S 259 Die haufigste Variation ist der Austausch des Kommas durch ein anderes Trennzeichen weswegen CSV oft auch als Akronym fur Character Separated Values verstanden wird RFC 4180 Common Format and MIME Type for Comma Separated Values CSV Files Oktober 2005 englisch RFC 4180 Common Format and MIME Type for Comma Separated Values CSV Files Oktober 2005 englisch fgetcsv PHP Handbuch Abgerufen von https de wikipedia org w index php title CSV Dateiformat amp oldid 234559100