www.wikidata.de-de.nina.az
Die Zeichen fur das Arabische und Syrische befinden sich in Unicode in acht verschiedenen Unicode Blocken Neben den einzelnen Zeichen definiert der Unicode Standard auch eine Reihe von Algorithmen zur korrekten Darstellung arabischer und syrischer Texte Inhaltsverzeichnis 1 Kodierte Zeichen 2 Schreibrichtung 3 Kontextabhangige Buchstabenformen 4 Ligaturen 5 Weitere Besonderheiten 6 QuellenKodierte Zeichen BearbeitenDie wichtigsten Zeichen fur das Arabische liegen im Unicodeblock Arabisch Neben den Buchstaben des arabischen Alphabets die in Umfang und Anordnung ISO 8859 6 entsprechen befinden sich hier auch Ziffern einige Satzzeichen die sich stark von denen unterscheiden die mit lateinischer Schrift verwendet werden und Sonderzeichen Auch wenn ein Buchstabe je nach Position im Wort verschiedene Darstellungsformen besitzt enthalt dieser Block nur jeweils ein Zeichen fur alle Varianten Das arabische Alphabet wird auch in anderen Sprachen verwendet die es um einige weitere Zeichen erganzen So gibt es etwa im persischen Alphabet vier zusatzliche Buchstaben Solche Buchstaben befinden sich zusammen mit Zeichen die nicht mehr in Gebrauch sind in den Blocken Arabisch Erganzung und Arabisch erweitert A Die beiden Blocke Arabische Prasentationsformen A und Arabische Prasentationsformen B enthalten vor allem fur Kompatibilitat mit anderen Standards Darstellungsvarianten und Ligaturen Der Unicodeblock Arabische mathematische alphanumerische Symbole schliesslich enthalt arabische Buchstaben fur den Gebrauch in mathematischen Formeln Die Buchstaben des syrischen Alphabets liegen im Unicodeblock Syrisch Anders als fur das Arabische gibt es hier keine Zeichen die in verschiedenen Darstellungsformen mehrfach kodiert sind Neben diesen Zeichen spielen die bidirektionalen Steuerzeichen und der breitenlose Verbinder bzw Nichtverbinder in der digitalen arabischen und syrischen Typografie eine Rolle Schreibrichtung BearbeitenArabisch und Syrisch wird von rechts nach links geschrieben nur Zahlen unabhangig von den verwendeten Ziffern schreibt man von links nach rechts Einige Satzzeichen etwa Klammern werden gespiegelt zur gewohnlichen Variante dargestellt Fur die korrekte Darstellung sieht der Unicode Standard wie fur andere linkslaufige Schriften den Unicode Bidi Algorithmus vor Kontextabhangige Buchstabenformen Bearbeiten nbsp Verschiedene Formen arabischer Buchstaben iii isolierte Formiv nach rechts verbundene Formv beidseitig verbundene Formvi nach links verbundene FormJe nach Stellung im Wort kann ein arabischer Buchstabe in bis zu vier verschiedenen Darstellungsformen auftreten Als isolierter Buchstabe etwa in Zeichentabellen als Buchstabe am Wortanfang wo er sich mit dem folgenden Buchstaben links verbindet am Ende eines Wortes wo er sich mit dem vorhergehenden Buchstaben rechts verbindet und in der Wortmitte wo er mit beiden Nachbarn verbunden ist Eine Schriftart muss also fur ein einziges Zeichen bis zu vier verschiedene Glyphen bereithalten Um die je nach Kontext korrekte Glyphe auszuwahlen wird der folgende Algorithmus verwendet Dazu weist Unicode jedem Zeichen eine Joining Type Eigenschaft zu Diese Eigenschaft gibt an ob und in welche Richtung sich das Zeichen mit den Nachbarzeichen verbindet Es gibt sechs verschiedene Werte R fur Zeichen wie etwa Alif oder Dal die nur nach rechts verbunden werden L fur Zeichen die nur nach links verbunden werden Im Arabischen gibt es kein Zeichen mit diesem Wert er wird allerdings in der Phagpa Schrift und fur Manichaisch verwendet D fur Zeichen wie etwa Ba oder Ta die zu beiden Seiten hin verbunden werden C fur Zeichen wie etwa das Kaschidazeichen oder den breitenlosen Verbinder die ebenfalls zu beiden Seiten eine Verbindung initiieren selbst aber unverandert bleiben U fur Zeichen die sich nicht mit ihren Nachbarn verbinden also etwa alle lateinischen Buchstaben oder auch der breitenlose Nichtverbinder T fur Zeichen wie kombinierende Zeichen die bei der Anwendung des Algorithmus ignoriert werden sollten Mit dieser Eigenschaft wird nach einem Regelwerk bestimmt in welcher Form ein Zeichen dargestellt werden soll Zeichen vom Typ R denen ein Zeichen vom Typ L D oder C vorausgeht wobei Zeichen vom Typ T ubergangen werden werden in der nach rechts verbundenen Form dargestellt analog werden Zeichen vom Typ L denen ein Zeichen vom Typ R D oder C folgt wobei Zeichen vom Typ T ubergangen werden werden in der nach links verbundenen Form dargestellt Fur Zeichen vom Typ D werden beide diese Regeln angewendet stehen auf beiden Seiten geeignete Zeichen so wird die zu beiden Seiten hin verbundene Form gewahlt steht nur auf einer Seite ein solches Zeichen auf der anderen nicht wird die entsprechend verbundene Form ausgesucht Trifft keine der Regeln zu so wird das Zeichen in der unverbundenen Form dargestellt Dieser Algorithmus wird auch fur die syrische Schrift verwendet wobei fur den syrischen Buchstaben Olaf spezielle zusatzliche Regeln gelten Weitere Schriftsysteme in denen dieser Algorithmus Anwendung findet sind N Ko Mongolisch Phagpa Manichaisch und Psalter Pahlavi Ligaturen BearbeitenEine weitere Besonderheit im Arabischen und Syrischen sind bestimmte Ligaturen die sich im Aussehen deutlich von den zusammengesetzten Einzelbuchstaben unterscheiden aus denen sie bestehen Fur die korrekte Darstellung der Ligaturen enthalt der Unicode Standard eine weitere Eigenschaft Joining Group Diese kann verschiedene Werte annehmen die nach den Buchstaben dieser Gruppe benannt werden So haben Lam und daraus abgeleitete Buchstaben alle den Wert Lam Folgt auf ein solches Zeichen ein Buchstabe aus der Gruppe Alef der Alif und abgeleitete Zeichen angehoren so werden diese beiden Zeichen durch die Lam Alif Ligatur dargestellt Weitere Besonderheiten Bearbeiten nbsp Syrisches AbkurzungszeichenEinige Zeichen erfordern eine besondere Darstellung beispielsweise U 06DD Ende einer Aya Dieses Zeichen umschliesst alle direkt folgenden Ziffern Um ein Zeichen als Ziffer zu erkennen konnen Computersysteme auf die allgemeine Kategorie des Zeichens zuruckgreifen Ahnliches gilt fur die Zeichen an den Codepunkten U 0600 bis U 0603 die allgemeine Zahlen Jahre Fussnoten und Seitenzahlen unterstreichen Im Syrischen gibt es das syrische Abkurzungszeichen U 070F das den Beginn einer Abkurzung anzeigt die dann mit einer ubergesetzten Linie mit einzelnen Punkten markiert werden soll Das nebenstehende Beispiel zeigt die ersten vier Buchstaben des syrischen Alphabets von denen die letzten drei vom syrischen Abkurzungszeichen uberspannt werden Quellen BearbeitenJulie D Allen et al The Unicode Standard Version 6 2 Core Specification The Unicode Consortium Mountain View CA 2012 ISBN 978 1 936213 07 8 Chapter 8 2 Arabic Chapter 8 3 Syriac online PDF Schriftsysteme in Unicode Lateinisch Griechisch und Koptisch Kyrillisch und Glagolitisch Hebraisch Arabisch und Syrisch Indische Schriften Ostasiatische Schriften Historische SchriftenInterpunktionszeichen Zahlzeichen Symbole Mathematische Zeichen Leerraum Steuerzeichen Abgerufen von https de wikipedia org w index php title Arabisch und Syrisch in Unicode amp oldid 199507601