www.wikidata.de-de.nina.az
Als Textdatei wird in der Informationstechnik eine Datei bezeichnet die darstellbare Zeichen enthalt und zum Speichern Bearbeiten zur Datenubertragung und Lesen dient Die 95 druckbaren Zeichen des ursprunglichen ASCII Inhaltsverzeichnis 1 Allgemeines 2 Geschichte 3 Abgrenzung von Binar und Textdateien 4 Kennzeichnung des Zeilenendes 4 1 Festlegung einer konstanten Zeilenlange 4 2 Kennzeichnung mittels Steuerzeichen 5 Weitere Steuerzeichen 6 Zeichencodierung 7 Austausch zwischen unterschiedlichen Systemen 8 Verwendung von Textdateien 8 1 Tabellarische Daten 8 2 XML 8 3 Weitere Dateiformate 9 Nutzung 10 Literatur 11 Weblinks 12 EinzelnachweiseAllgemeines BearbeitenDie Zeichen konnen durch Steuerzeichen wie Zeilen und Seitenwechsel untergliedert sein Ein Text ist aus Sicht der Informationstechnologie ein aus Buchstaben des Alphabets Zahlzeichen und anderen Zeichen wie Sonderzeichen zusammengesetzter Datenbestand der in einer Textdatei erfasst ist 1 Das Gegenstuck zur Textdatei ist eine Binardatei Im Grunde werden auch Textdateien binar gespeichert die Begriffe werden jedoch komplementar verwendet denn die Interpretation des binaren Inhalts ist ausschlaggebend Bei einer Textdatei wird der Inhalt als sequenzielle Folge von Zeichen eines Zeichensatzes interpretiert bei einer Binardatei ist eine beliebige anderweitige Interpretation des Inhalts moglich 2 Folglich ist eine Textdatei im Gegensatz zu einer Binardatei ohne die Verwendung spezieller Programme lesbar und kann mit einem einfachen Texteditor wie beispielsweise mit Notepad unter Windows oder vi oder Nano unter Unix betrachtet und bearbeitet werden 3 Im Gegensatz zu dieser fachsprachlichen Definition des Begriffs Textdatei bei der das Dateiformat ausschlaggebend ist orientiert sich die umgangssprachliche Verwendung des Begriffs haufig primar am fur den Endbenutzer sichtbaren Inhalt der Datei Dabei werden etwas unscharf alle Dateien als Textdatei bezeichnet die mit dem Ziel erstellt wurden einen lesbaren Text zu prasentieren unabhangig davon in welcher Form sie gespeichert werden Bei den von ublicher Textverarbeitungs oder Publishingsoftware bei Speicherung erzeugten Dateien handelt es sich jedoch haufig um komplexe Dateiformate die neben dem Text Metainformation zur Beschreibung des Textlayouts der Struktur und der verwendeten Schriften enthalten zudem konnen Bilder oder Grafiken eingebettet sein Deshalb handelt es sich um keine Textdateien im fachsprachlichen Sinn da die Dateiformate haufig binar sind und zur Anzeige eine spezielle Software erforderlich ist Bei einer Textdatei im fachsprachlichen Sinn wird die Menge der verfugbaren Zeichen durch die zugrunde liegende Codierung bestimmt Am gebrauchlichsten sind hierbei ASCII oder UTF 8 eine Codierung des Unicode Eine solche Textdatei muss dabei nicht notwendigerweise Text enthalten es kann sich beispielsweise auch um ASCII Art handeln also um Piktogramme auf Basis der verfugbaren Zeichen Wenn es sich jedoch um Text handelt und zum Verstandnis der Bedeutung weder besondere Verarbeitungsschritte noch die Kenntnis einer speziellen Notation erforderlich sind wird der Inhalt als Plain text bezeichnet 4 Die Zeichenmenge wird aber auch haufig durch eine naturliche oder formale Sprache eingeschrankt Textdateien die eine bestimmte Notation erfordern wie beispielsweise HTML Dateien konnen zwar mit einem einfachen Texteditor bearbeitet werden jedoch gibt es hierfur oft spezielle Programme die die Bearbeitung erleichtern beispielsweise durch besondere Hervorhebungen oder automatische Formatierungen Geschichte BearbeitenIn der Anfangszeit der elektronischen Datenverarbeitung war die Unterscheidung zwischen Text und Binardateien einfacher als heute Bei einer Textdatei wurde ein Zeichen immer direkt in ein spezielles Bitmuster umgesetzt Die Datei konnte ohne Umwege das heisst Zeichen fur Zeichen ohne jegliche Umsetzung durch ein spezielles Programm zu einem Terminal Drucker oder Fernschreiber ubertragen werden 5 Der bei Ubertragung zwischen Fernschreibern verwendete Baudot Code ist auch der Ursprung der in Textdateien zu findenden Steuerzeichen Zeilenvorschub oder Wagenrucklauf Zur Umsetzung der physisch gespeicherten Bitfolgen in einem Text wird eine Zeichenkodierung verwendet Fruher wurde dabei nahezu ausschliesslich ein Zeichen immer in genau ein Byte umgesetzt also im Regelfall eine Gruppe von 8 Bit die so 256 entspricht 28 verschiedene Zeichen ermoglichte Bei der Codierung mittels ASCII in der ursprunglichen Definition wurden tatsachlich nur 7 Bits verwendet 6 Mit den 7 oder 8 Bit Zeichensatzen kann nur jeweils eine Schrift in einer Datei verwendet werden die Verwendung verschiedener Sprachen ist nur bedingt moglich Die ostasiatischen Schriftsysteme wie Japanisch Chinesisch und Koreanisch konnen praktisch uberhaupt nicht abgebildet werden Mit ISO 2022 gab es im Jahr 1986 erstmals einen Standard der die Verwendung verschiedener Schriften in einer Textdatei ermoglichte und der auch Schriften vorsah die mehr als 256 verschiedene Schriftzeichen verwenden Dieser Standard erlangte aber nur im ostasiatischen Raum nennenswerte Verbreitung und wurde durch den 1991 erstmals veroffentlichten Unicode verdrangt der langfristig alle existierenden Schriftsysteme abbilden soll 7 8 Spatestens seit Einfuhrung von Unicode stellt sich die Umsetzung eines Zeichens in seine binare Reprasentation komplizierter dar da es hierfur mehrere Varianten gibt und ein Zeichen nicht immer mit der gleichen Anzahl Bytes umgesetzt wird Da der Austausch von Dateien zwischen unterschiedlichen Rechnersystemen nicht zuletzt durch das Internet wichtiger geworden ist und Textdateien im Vergleich zu Binardateien auf einfachere Weise eine systemunabhangige Bearbeitung von Dateien ermoglichen hat das Textformat an Bedeutung gewonnen Jedoch ist insbesondere auch durch die vielfaltige Verwendung von Textdateien der Begriff selbst unzweckmassiger und unscharfer geworden 9 10 Abgrenzung von Binar und Textdateien BearbeitenBei vielen Betriebssystemen existieren Konventionen in Bezug auf die Endung von Dateinamen zur Kennzeichnung des Dateityps Unter Windows und macOS wird dem Namen einer Textdatei meist die Endung txt angehangt auch bei anderen Betriebssystemen wie beispielsweise Linux wird diese Dateiendung teilweise verwendet Die zur Standardisierung des technischen Formats von E Mails entworfenen Multipurpose Internet Mail Extensions MIME definieren sogenannte Medientypen die mittlerweile neben dem E Mail Verkehr auch in vielen anderen Bereichen zur Kennzeichnung des Dateityps verwendet werden Der Medientyp text kennzeichnet dabei Text Die vollstandige Typangabe wird noch um einen Subtyp erganzt der den Verwendungszweck des Textes spezifiziert Bei Textdateien die direkt den eigentlichen Text enthalten der nicht fur eine bestimmte maschinelle Weiterverarbeitung bestimmt ist lautet die vollstandige Typangabe text plain Fur den in einer Textdatei enthaltenen Text konnen keine besonderen Formatierungen wie beispielsweise Hervorhebungen durch Fettdarstellung festgelegt werden Manche Codierungen erlauben das Stapeln diakritischer Zeichen oder die Darstellung von bidirektionalem Text 4 Eine mit einer Textverarbeitung wie beispielsweise Microsoft Word oder LibreOffice Writer erstellte Datei ist im Normalfall keine Textdatei 11 selbst wenn ausschliesslich Text erfasst wurde da der Text nur unter Verwendung eines geeigneten Textverarbeitungssystems wieder angezeigt und bearbeitet werden kann Auch ein im PostScript ps Portable Document Format PDF pdf oder TeX DVI dvi vorliegender Text ist keine Textdatei weil diese codierte Formatinformationen enthalt die auch binar sein konnen Ebenso handelt es sich bei Texten die mittels eines Scanners eingelesen werden nicht um Textdateien Diese sind vielmehr Bilddateien sofern sie nicht nach dem Scan Vorgang mittels einer Texterkennungs Software OCR optical character recognition in eine Textdatei umgewandelt werden Bei einer Datenkomprimierung kann bei Textdateien im Regelfall eine erheblich grossere Einsparung bei der Speichergrosse erzielt werden als bei Binardateien Dies liegt daran dass bei Textdateien die Informationsdichte geringer ist als bei den meisten Binardateien was die gangigen Komprimierungsalgorithmen ausnutzen beispielsweise durch Verwendung der Huffman Kodierung 12 Kennzeichnung des Zeilenendes BearbeitenGrundsatzlich gibt es zwei Moglichkeiten festzulegen an welcher Stelle eine neue Zeile im Text beginnen soll die Festlegung einer konstanten Anzahl Zeichen pro Zeile oder die Verwendung definierter spezieller Zeichen zur Markierung des Zeilenendes Festlegung einer konstanten Zeilenlange Bearbeiten Die Verwendung einer festen Zeilenlange hat den Vorteil dass die Position einer bestimmten Zeile innerhalb der Zeichenfolge Bytefolge der Datei ermittelt werden kann ohne die Datei Zeile fur Zeile lesen zu mussen Allerdings hat sie den Nachteil dass Zeilen mit kurzerem Inhalt aufgefullt werden mussen siehe Padding dies erfolgt in der Regel mit Leerzeichen Dadurch beansprucht die Datei mehr Speicherplatz als notig wenn die Zeilenlange nicht ausgeschopft wird Eine solche feste Zeilenlange ist nur auf Grossrechner Systemen gebrauchlich Die Satzlange wird dabei vom Dateisystem verwaltet oder ist bei Zugriff auf die Datei anzugeben Sehr haufig ist die Satzlange von 80 Zeichen da diese Anzahl Zeichen bei zeichenorientierten Terminals in einer Zeile dargestellt werden kann was wiederum auf die historischen Lochkarten zuruckgeht 13 Kennzeichnung mittels Steuerzeichen Bearbeiten Die ubliche Definition des Zeichens zur Kennzeichnung des Zeilenendes erinnert an die ursprungliche direkte Datenausgabe von Textdateien auf Fernschreibern oder Druckern die in ihrer Bauart einer Schreibmaschine entsprachen Dort waren die Befehle Wagenrucklauf Carriage Return CR und Zeilenvorschub Line Feed LF notwendig um die Fortsetzung der Druckausgabe am Beginn der nachsten Zeile zu veranlassen bei einem Fernschreiber waren das zwei separate Tasten Diese beiden Steuerzeichen waren folglich die aussichtsreichsten Kandidaten um als Markierung des Zeilenendes bei elektronischer Speicherung von Dateien verwendet zu werden Im Prinzip ist dabei aber ein Zeichen von beiden ausreichend und diese Wahlmoglichkeit fuhrte dazu dass die Festlegung uneinheitlich erfolgte was bis heute eine Komplikation beim systemubergreifenden Austausch von Dateien darstellt 14 15 Hauptsachlich auf der Plattform der IBM PC kompatibler Computer unter Betriebssystemen wie PC kompatibles DOS oder Windows wird die Folge von CR und LF ASCII zwei Bytes zur Markierung des Zeilenendes verwendet Unter Unix und Unixartigen Betriebssystemen beispielsweise Linux wird das Zeilenende alleine mittels LF ASCII UTF 8 ein Byte gekennzeichnet Bei alteren Betriebssystemen von Apple beispielsweise System 1 bis Mac OS 9 1984 2001 war mit der ausschliesslichen Verwendung von CR eine dritte Moglichkeit gebrauchlich In der IBM Grossrechnerwelt wird im EBCDIC neben diesen beiden Zeichen noch ein weiteres spezielles Zeichen New Line NL verwendet 16 Die diesbezuglich meisten Probleme entstehen beim Austausch von Dateien haufig z B zwischen der Windows und Unix Plattform da diese uber weite Bereiche denselben Zeichencode verwenden und mit Ausnahme des Zeilenende Zeichens im Regelfall keine Konvertierung der Dateien erforderlich ist Weitere Steuerzeichen BearbeitenNeben der Kennzeichnung des Zeilenendes konnen insbesondere bei Verwendung des ASCII in Textdateien weitere Steuerzeichen auftreten Diese waren vor allem ublich als der Inhalt der Textdateien noch direkt zum Terminal oder Drucker ubertragen wurde Die wichtigsten dabei sind das Zeichen Form Feed FF das die Position eines Seitenwechsels im Text markiert und Horizontal Tabulation HT das Tabulatorzeichen das eine Einruckung des Textes kennzeichnet Um die Darstellung des Textes noch differenzierter beeinflussen zu konnen wurden in Verbindung mit Textdateien teilweise Escape Sequenzen verwendet Sie bestehen aus dem einleitenden Steuerzeichen Escape ESC und einer Folge weiterer Zeichen die eine Darstellungsanweisung codieren Der sich hierbei etablierte Standard sind ANSI Escapesequenzen nach ANSI X3 41 1974 und X3 64 1977 die ursprunglich zur Ansteuerung von Terminals wie den VT Modellen von DEC entwickelt wurden 17 Beim Drucken war zur Zeit der Nadeldrucker der von Epson eingefuhrte Standard ESC P weit verbreitet so dass derartige Escape Sequenzen auch in Textdateien zu finden waren Zeichencodierung BearbeitenDer bei Textdateien physisch binar vorliegende Inhalt wird nach einer fur die jeweilige Datei fest vorgegebenen Regel in Text umgewandelt Dabei sind folgende Zeichencodierungen gebrauchlich ASCII stellt das am weitesten verbreitete Format dar insbesondere wenn die diversen Erweiterungen des Standards einbezogen werden ISO 8859 1 auch bekannt als Latin 1 und ISO 8859 15 sind standardisierte Erweiterungen des ASCII die die Grundlage des bei Windows im englischen und westeuropaischen Sprachraum verwendeten Codes Windows 1252 bilden EBCDIC ist eine auf Grossrechnern von IBM gebrauchliche Codierung Unicode ist ein internationaler Standard der weltweit alle sinntragenden Zeichen abbildet Im Gegensatz zu obigen Codierungen kommt Unicode dabei nicht mit 8 Bit das heisst einem Byte aus da Unicode weit mehr als 256 verschiedene Zeichen definiert Bei der Verwendung von Unicode ist die generelle Umsetzung eines Zeichens in ein Byte nicht anwendbar Es gibt unterschiedliche Verfahren Unicode in eine Bytefolge umzusetzen Am meisten verwendet werden hierbei Codierungen mit dem Ziel die Dateigrosse bei Auftreten der gebrauchlichsten Zeichen zu minimieren Hierfur wird allerdings die Regel geopfert dass jedes Zeichen immer mit derselben Anzahl Bytes codiert wird Ein Beispiel hierfur ist die verbreitete Codierung UTF 8 18 die zudem die Besonderheit aufweist dass alle im ursprunglichen ASCII enthaltenen Zeichen genau auf die gleiche Weise wie bei ASCII in einem Byte codiert werden Der binare Inhalt einer Datei die ausschliesslich aus solchen Zeichen besteht ist also identisch unabhangig davon ob sie in ASCII oder UTF 8 codiert wurde nbsp Fehlerhafte Darstellung bei Verwendung der falschen CodierungBei Unicode existiert zudem die Konvention am Beginn einer Datei mittels spezieller Bytefolgen sogenannte Byte Order Marks kenntlich zu machen welche Unicode Codierung verwendet wird Dies ist auch deshalb notig da auf vielen Systemen auch unter Windows die bisherige auf ASCII basierende Codierung und Unicode parallel verwendet werden Bei einer solchen Codierung beginnt die Grenze zur Binardatei zu verschwimmen Wird eine Textdatei unter Verwendung einer falschen Zeichencodierung interpretiert kann sie ganzlich unlesbar sein wenn vollstandig inkompatible Codierungen verwendet werden wie beispielsweise ASCII und EBCDIC Wird hingegen eine abweichende aus dem ursprunglichen ASCII abgeleitete Codierung verwendet werden lediglich die Sonderzeichen beispielsweise die deutschen Umlaute falsch dargestellt da diese nicht Bestandteil der ersten 128 standardisierten Zeichen des ASCII sind Austausch zwischen unterschiedlichen Systemen BearbeitenWenn Textdateien von einem System auf ein System anderen Typs ubertragen werden muss berucksichtigt werden ob die durch die Systeme verwendeten Zeichencodierungen ubereinstimmen Weiterhin ist das zur Kennzeichnung des Zeilenendes verwendete Verfahren zu berucksichtigen siehe oben Der Austausch von Dateien die nur die ersten 128 Zeichen des ASCII verwenden ist auf Systemen die diese oder eine daraus abgeleitete Codierung verwenden meist recht problemlos Auch die Unicode Codierung UTF 8 stimmt bei ausschliesslicher Verwendung dieser Zeichen exakt mit ASCII uberein Werden hingegen weitere Zeichen verwendet ist oft eine Konvertierung erforderlich Zu beachten ist allerdings dass eine Konvertierung nur dann durchzufuhren ist wenn die Datei auf dem Zielsystem selbst auch angezeigt wird Wird die Datei auf diesem System nur gespeichert und zur Anzeige wieder auf ein System ubertragen das die ursprungliche Codierung verwendet ware eine Konvertierung unnotig und moglicherweise sogar schadlich da durch diese doppelte Konvertierung Information verloren gehen kann Beim Austausch von Textdateien als Anhang einer E Mail konnen Unstimmigkeiten auftreten Das Problem liegt dabei meist beim Absender da dessen Mail Client haufig die Codierung der Textdatei nicht korrekt ermitteln kann vom Benutzer aber diese Angabe aus Grunden der Benutzerfreundlichkeit nicht fordert und so keine entsprechende oder eine falsche Information in die Mail eintragt Im Prinzip sind die meisten heute gebrauchlichen Mail Clients in der Lage die Codierung im Bedarfsfall zu konvertieren Bei einer direkten Dateiubertragung File Transfer zwischen Systemen wird meist ein spezielles Programm zur Ubertragung verwendet Dieses ubernimmt auch die notwendigen Konvertierungen auch wenn die Codierungen beider Systeme ganzlich unterschiedlich sind wie beispielsweise beim Austausch zwischen Windows und IBM Grossrechnern Bei einer Ubertragung muss im Regelfall angegeben werden ob es sich bei der zu ubertragenden Datei um eine Text oder Binardatei handelt um festzulegen ob eine Konvertierung der Datei erfolgen soll oder zu unterlassen ist der Inhalt einer Binardatei wurde durch eine solche Konvertierung zerstort 19 Verwendung von Textdateien BearbeitenDer ursprungliche und einfachste Verwendungsfall von Textdateien ist die Ubermittlung des enthaltenen Textes als eigentliche Information englisch Plain text Textdateien konnen aber unter Anwendung eines im Vorhinein festzulegenden formalen Aufbaus dazu genutzt werden komplexere Daten zu ubermitteln Die Datei ist dann meist nicht mehr primar fur die direkte Nutzung durch den Anwender gedacht sondern wird durch ein bestimmtes Programm weiterverarbeitet oder durch einen Systemadministrator gepflegt In vielen Fallen werden auf diese Weise heute Textdateien genutzt in denen eigentlich Binardateien pradestiniert erscheinen weil nur eine maschinelle Weiterverarbeitung erfolgt Der ausschlaggebende Nachteil der Binardateien hier ist dass deren Struktur uber Systemgrenzen hinweg noch weit inhomogener als die von Textdateien ist siehe beispielsweise Byte Reihenfolge Dafur haben Textdateien den Nachteil dass zur Speicherung derselben Information mehr Speicherplatz erforderlich ist und dass die Daten vielfach bei einer Weiterverarbeitung erst wieder ins binare Format konvertiert werden mussen Da aber vor allem durch das Internet der systemubergreifende Austausch von Daten immer bedeutender geworden ist ist eine Datenspeicherung in Textdateien heute vielfach ublich Auch fur durch Administratoren oder privilegierte Benutzer zu pflegende Konfigurationsdateien wird haufig das Textformat verwendet Bei einem binaren Format ware jeweils ein spezielles Konfigurationsprogramm erforderlich bei Verwendung des Textformats kann die Konfigurationsdatei direkt mittels eines Texteditors bearbeitet werden Tabellarische Daten Bearbeiten Textdateien werden aus verschiedenen Grunden zur Speicherung von Daten mit tabellarischer Struktur verwendet So strukturierte Dateien konnen mit einem Tabellenkalkulationsprogramm beispielsweise Calc aus den Paketen LibreOffice und Apache OpenOffice oder Microsoft Excel weiterverarbeitet werden Datenbankdaten werden haufig auf diese Weise exportiert um diese zwischen meist unterschiedlichen Anwendungsprogrammen auszutauschen auch wenn heute das XML Format fur einen solchen Fall pradestiniert erscheint Es gibt verschiedene Verfahren zur tabellarischen Anordnung der Daten in Textdateien von denen die folgenden die gebrauchlichsten sind Trennung der Spalten durch Tabulator Das Tabulatorzeichen ein spezielles Steuerzeichen wird innerhalb einer Zeile zur Kennzeichnung der Spaltengrenzen verwendet CSV Format Dieses Format das ursprunglich Comma Separated Values bedeutete ist ahnlich der Trennung durch Tabulatorzeichen nur wird in der Regel im englischen Sprachraum eben das Komma im deutschen aber der Strichpunkt als Trennzeichen verwendet Festlegung einer konstanten Anzahl Zeichen pro Spalte Um eine solche Datei verwenden zu konnen muss bekannt sein welche Breite jede einzelne Spalte hat Diese Definition wird selbst nicht in der Datei gespeichert XML Bearbeiten XML Extensible Markup Language ist ein Meta Dateiformat Es definiert also in welchem Format definiert wird wie die Struktur einer Datei aussieht 20 XML ist dabei bewusst ein Textformat und soll fur Mensch und Maschine gleichermassen lesbar sein auch soll ein systemubergreifender Austausch von XML Daten problemlos ermoglicht werden 21 XML Dateien sind also grundsatzlich Textdateien deren grobe Strukturierung standardisiert ist und die vor allem zum Datenaustausch oder zur Datenspeicherung verwendet werden der genaue Verwendungszweck wird von XML selbst nicht vorgegeben Ein Beispiel fur ein auf XML basierendes Format ist SVG Scalable Vector Graphics ein Grafikformat das somit im Prinzip lesbar in einer Textdatei codiert ist Die Dateiformate der Textverarbeitungen OpenDocument OpenOffice org und Office Open XML der neueren Versionen von Microsoft Word erkennbar an der Dateierweiterung docx statt doc basieren auf XML und die gespeicherten Dateien sind demzufolge Textdateien Dabei ist aber zu beachten dass der Text der bei direkter Bearbeitung einer solchen Datei sichtbar wird nicht der eigentliche Textinhalt des Dokuments ist sondern die Beschreibung des Textdokuments auf einer Metaebene 22 Weitere Dateiformate Bearbeiten Neben XML Formaten existieren noch einige meist altere recht weit verbreitete Auszeichnungssprachen die haufig verwendet und in Form einer Textdatei gespeichert werden 23 Das Dateiformat definiert unter anderem Zugehorigkeit Aufgabe und Klasse der Datei Betriebssystemdatei oder Videodatei usw 24 In welchem Dateiformat eine Datei gespeichert wurde lasst sich an ihrer Dateinamenserweiterung erkennen etwa exe fur ein ausfuhrbares Computerprogramm oder wmv fur ein Windows Metafile Die wichtigsten Dateiformate fur Textdateien sind 25 Dateiformat DateiendungTextdatei txtMicrosoft Word docOffice Open XML docx und andereMicrosoft Access accMicrosoft PowerPoint ppt und andereOpenDocument odt und andereApple Pages pagesPortable Document Format 26 pdfRich Text Format rtfMicrosoft Excel xls und andereExtensible Markup Language xmlHTML die Sprache zur Gestaltung von Inhalten im World Wide Web ist von der Struktur her verwandt mit XML Rich Text Format RTF ist eine Sprache zum Austausch von formatiertem Text zwischen Textverarbeitungsprogrammen auch auf unterschiedlichen Plattformen TeX und LaTeX stellen ein Textsatzsystem dar das zur Textgestaltung eine spezielle Sprache verwendet die in Textdateien codiert wird PostScript ist ein Dateiformat das professionelle Druckformatierungen ermoglicht und in Form einer Textdatei gespeichert wird Die Binardaten enthaltener Grafiken werden als hexadezimale Ziffern in Text umgesetzt Da viele Drucker dieses Format direkt interpretieren konnen geben viele Textverarbeitungs oder Desktop Publishing Programme ihre Ergebnisse im PostScript Format aus PostScript wird allerdings in einigen Bereichen von PDF verdrangt Daneben existieren noch viele weitere und auch proprietare Formate deren Aufbau sich nur bei Verfugbarkeit einer entsprechenden Spezifikation erschliesst Nutzung BearbeitenSpeichern Das Speichern einer Textdatei geschieht mit Hilfe eines Datenspeichers der ein bestimmtes Dateiformat unterstutzt Dazu wird das Menu Speichern ausgewahlt das fur die Speicherung sorgt 27 Moderne Betriebssysteme ordnen uber das Dateiformat Anwendungen zu welche die Dateien interpretieren konnen Lesen und Bearbeiten Unter Windows und im Vorlaufersystem MS DOS beide von Microsoft dienen die Kommandozeilenbefehle TYPE und a href More Kommandozeilenbefehl html title More Kommandozeilenbefehl MORE a der Anzeige von Textdateien Unter allen Betriebssystemen gibt es Texteditoren zur direkten Anzeige und Bearbeitung von Textdateien beispielsweise vi oder Nano unter Unix Dabei ermoglichen praktisch alle Texteditoren in einer Datei direkt nach speziellen Textinhalten zu suchen Viele Texteditoren bieten auch eine Unterstutzung bei der Darstellung spezieller Dateiformate so werden verschiedene Syntaxelemente entsprechend ihrer Bedeutung hervorgehoben beispielsweise durch Einfarbungen Mithilfe eines Texteditors kann eine Datei im Regelfall auch gedruckt werden Die Bearbeitung erfolgt durch Aufruf des Menus Offnen das den Texteditor aktiviert Durch Suchen und Ersetzen lasst sich die zu andernde Passage finden der gesamte Dateiinhalt kann verandert werden Sowohl bei der Anzeige in einem Texteditor als auch beim Ausdrucken kann das Problem auftreten dass die Einruckung von Zeilen nicht korrekt dargestellt wird Dies liegt meist daran dass in der Datei das Tabulatorzeichen enthalten ist fur das nicht einheitlich definiert ist wie weit die Einruckung erfolgen soll Um wie viele Zeichen eingeruckt wird ist deshalb eine Konfigurationsinformation des Editors oder Druckers Erschwerend kommt hinzu dass bei der Anzeige im Texteditor der Unterschied zwischen Leerzeichen und einem Tabulatorzeichen meist nicht oder nur schwer ersichtlich ist Texteditoren fugen haufig automatisch weiche Zeilenumbruche ein wenn die Breite des verwendeten Bildschirmfensters zur Anzeige der gesamten Zeile nicht ausreicht Auch bei Druckausgabe kann es zum Einfugen solcher weichen Zeilenumbruche kommen Diese Zeilenumbruche sind nicht in der Datei selbst enthalten und konnen bei Ausgabe auf einem anderen Medium an anderer Stelle erfolgen Oft sind diese vom Anwender nur schwer von den eigentlichen harten Zeilenumbruchen zu unterscheiden also den Zeilenumbruchen die der Anwender selbst beispielsweise unter Verwendung der entsprechenden Taste in der Datei eingefugt hat und die auch in der Datei gespeichert werden Die Texte konnen entweder auf einem Computer eingesehen werden oder durch den Drucker auf Papier gebracht werden Datenubertragung Die Datenubertragung uber das Internet durch Download bzw Upload ist fur Laien kompliziert zumal sie im Hintergrund geschieht Das Transmission Control Protocol TCP zerlegt eine zu versendende Datei in einzelne kleinere Datenpakete und versendet diese getrennt voneinander uber das Internet Dabei kann ein Datenpaket verschiedene Knotenpunkte im Internet wie Hostrechner Server durchlaufen weil an jedem Knotenpunkt der optimale Weg fur das Paket neu bestimmt wird 28 Da unterwegs die ursprungliche Reihenfolge nicht eingehalten werden muss hat das TCP auch die Aufgabe die ursprungliche Reihenfolge beim empfangenden Endgerat wiederherzustellen Das Internet Protocol IP regelt die korrekte Adressierung Rechnerarchitektur Adressierung der Datenpakete damit die im Internet angeschlossenen Computer eindeutig identifiziert werden konnen 29 Die Datenubertragung der digitalen Daten beginnt mit dem Upload beim Absender und endet mit dem Download beim Empfanger Literatur BearbeitenSascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 Nell B Dale John Lewis Computer science illuminated Jones and Bartlett Publishers Sudbury 2007 ISBN 978 0 7637 4149 5 Weblinks Bearbeiten nbsp Wiktionary Textdatei Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen nbsp Commons Textdateien Sammlung von Bildern Videos und Audiodateien File extensions used for text files dotwhat net Power Of Plain Text c2 comEinzelnachweise Bearbeiten Detlef Jurgen Brauner Robert Raible Besten Martin M Weigert Hrsg Multimedia Lexikon 1998 S 340 Khalid Azim Mughal Torill Hamre Rolf W Rasmussen Java Actually A First Course in Programming Cengage Learning EMEA London 2007 ISBN 1 84480 418 6 S 268 Google books Nell B Dale John Lewis Computer science illuminated Jones amp Bartlett Learning Burlington 2013 ISBN 978 1 4496 6573 9 S 364 f Google books a b RFC 4288 Media Type Specifications and Registration Procedures Abschnitt 4 2 1 englisch Steve Moritsugu Sanjiv Guha David Pitts Practical Unix Que 1999 ISBN 0 7897 2250 X S 218 books google de Der Sachverhalt dass das hochstwertige Bit in Textdateien die den ursprunglichen ASCII verwendeten immer 0 war wurde auch von Heuristiken zur Unterscheidung von Text und Binardateien verwendet Peter Constable Character set encoding basics Understanding character set encodings and legacy encodings Memento vom 5 Mai 2013 im Internet Archive sil org Richard Gillam Unicode Demystified A Practical Programmer s Guide to the Encoding Standard Boston 2003 ISBN 0 201 70052 2 S 38 ff Sascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 S 779 Sascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 S 848 f Zumindest enthalten die von Textverarbeitungen verwendeten Dateiformate nicht direkt den eigentlichen Text da aber aktuelle Textverarbeitungssoftware haufig ein auf XML basierendes Dateiformat verwendet kann man diese Datei auf anderem Abstraktionsniveau als Textdatei betrachten siehe XML Hans Werner Lang Codierungstheorie Huffmann Code Seite der Hochschule Flensburg 1997 2022 abgerufen am 22 Oktober 2022 G D Brown zOS JCL Job Control Language im Betriebssystem z OS MVS Munchen 2004 ISBN 3 486 27397 3 S 124 ff Sascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 S 779 Sascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 S 824f EBCDIC NL in ASCII CR LF konvertieren IBM Integration Bus ibm com abgerufen am 22 Oktober 2022 Manual fur VT100 Terminal vt100 net englisch Michael Schonitzer Encodings schoenitzer de RFC 959 File Transfer Protocol englisch Sarah Coppin Brent Hendricks XML Basics cnx org Mario Jeckle Extensible Markup Language XML Memento vom 21 Dezember 2007 im Internet Archive jeckle de Walter Ditch XML based Office Document Standards PDF 1 5 MB JISC Bristol 2007 Sascha Kersken IT Handbuch fur Fachinformatiker Galileo Computing Bonn 2009 ISBN 978 3 8362 1420 9 S 823 Peter Winkler Computer Lexikon 2010 2009 S 211 Hardy Seifert Marco Bettner Markus Betschelt E Learning in der Sekundarstufe I 2021 S 10 f PDF speichert Texte Bilder und Grafiken Martin Evening Adobe Photoshop fur Fotografen 2006 S 20 Siegfried G Haberle Das neue Lexikon der Betriebswirtschaftslehre 2008 S 1247 f Siegfried G Haberle Das neue Lexikon der Betriebswirtschaftslehre 2008 S 1248 nbsp Dieser Artikel wurde am 8 Januar 2010 in dieser Version in die Liste der lesenswerten Artikel aufgenommen nbsp Dieser Artikel ist als Audiodatei verfugbar source source Speichern 28 25 Minuten 12 6 MB Text der gesprochenen Version 27 Mai 2015 Mehr Informationen zur gesprochenen Wikipedia Abgerufen von https de wikipedia org w index php title Textdatei amp oldid 235778797