www.wikidata.de-de.nina.az
Ein Uniform Resource Identifier Abk URI englisch fur einheitlicher Bezeichner fur Ressourcen ist ein Identifikator und besteht aus einer Zeichenfolge die zur Identifizierung einer abstrakten oder physischen Ressource dient URIs werden zur Bezeichnung von Ressourcen wie Webseiten sonstigen Dateien Aufruf von Webservices aber auch E Mail Empfangern im Internet und dort vor allem im WWW eingesetzt Der aktuelle Stand 2016 ist als RFC 3986 1 publiziert Ursprunglich fuhrte Tim Berners Lee den Begriff 1994 im RFC 1630 2 als Universal Resource Identifier ein Erst spater tauchte dann in offiziellen W3C Dokumenten die Auflosung Uniform auf Aus diesem Grund wird Universal gelegentlich selbst in der Fachliteratur als erster Namensbestandteil genannt URIs konnen als Zeichenfolge kodiert mit einem Zeichensatz in digitale Dokumente insbesondere solche im HTML Format eingebunden oder auch von Hand auf Papier aufgeschrieben werden Einen Verweis von einer Webseite auf eine andere nennt man Hyperlink oder kurz Link Eine Erweiterung der nur aus druckbaren ASCII Zeichen bestehenden URIs sind die Internationalized Resource Identifiers IRIs Inhaltsverzeichnis 1 Konzeption 2 Aufbau 2 1 Schema Scheme 2 2 Authority im Sinne von Zustandigkeit 2 3 Pfad Path 2 4 Abfrage Query 2 5 Fragment 2 6 Beispiele 3 URI Referenzen 3 1 Absolute URIs 3 2 Relative Referenz 3 3 Referenz innerhalb desselben Dokumentes 3 4 Suffix Referenzen 4 Schemata 5 Unterarten 6 Siehe auch 7 Weblinks 8 EinzelnachweiseKonzeption BearbeitenEin URI oder in der Erweiterung IRI ist das abstrakte Prinzip die Syntax einer Kennzeichnung bei dem ein Satz an Regeln vorgegeben ist Dieses Grundkonzept der URI wird dann auf verschiedene konkrete Anwendungsbereiche ubertragen fur die dann die entsprechenden Regeln und Begriffe gelten Zum Beispiel URI durfen keine Leerzeichen enthalten oder Zu Beginn steht der Name eines Schemas in ASCII Buchstaben und Ziffern gegebenenfalls gegliedert durch Punkt und Bindestrich beginnend mit Buchstaben worauf ein Doppelpunkt folgt Grundsatzlich gibt es drei Typen von Anwendungen Name Der Inhalt einer Ressource und damit jede inhaltsgleiche Kopie erhalt eine eindeutige Kennung Beispiel Die ISBN eines Buches Es gibt unbegrenzt viele Exemplare dieses Buches Locator Der Ort einer Ressource ist uber ihren Bezeichner definiert Sie wird also daruber identifiziert wo sie zu finden ist es wird damit jedoch nicht zwangslaufig ihr Inhalt festgelegt Beispiel Aktueller Wetterbericht im Internet Es ist bekannt an welcher Stelle URL dieser zu finden ist der Inhalt andert sich standig Beispiel Ein Buch wird dadurch beschrieben in welcher Bibliothek es steht dort im zweiten Raum drittes Regal viertes Fach von oben funftes Buch von links Dort konnten die aktuellen Top 5 der Bestsellerliste stehen unabhangig von ihrem Inhalt Individuum Die Regeln der URI konnen auch angewendet werden wenn etwas uberhaupt keine klassische Ressource ist trotzdem identifiziert werden soll Zunachst verstand man unter Ressource etwas wie Ressourcen im informationstechnischen Sinn also im weitesten Sinne elektronische Dateien die auch im Internet verfugbar gemacht werden konnten Davon gingen 1994 die RFC 1630 2 und RFC 1738 3 aus Dieses Konzept wurde jedoch erweitert So war 1998 in der RFC 2396 Abschnitt 1 1 4 festgelegt worden A resource can be anything that has identity Auch Personen Organisationen und gedruckte Bucher konnten als Ressource betrachtet werden Diese Betrachtung zielt auf die Kennzeichnung zuordnungsfahiger Entitaten Beispiele E Mail Adresse Nummer eines Mobiltelefons Reisepass sowie die legitime Inhaberin Sozialversicherungsnummer Fingerabdruck und der Mensch dazu Im Januar 2005 wurde mit RFC 3986 1 das Konzept der Ressource im Sinne der URI auch noch um abstrakte Konzepte erweitert A resource is not necessarily accessible via the Internet e g human beings corporations and bound books in a library can also be resources Likewise abstract concepts can be resources such as the operators and operands of a mathematical equation the types of a relationship e g parent or employee or numeric values e g zero one and infinity Eine Ressource ist nicht notwendigerweise uber das Internet erreichbar beispielsweise konnen Menschen Firmen und gebundene Bucher in Bibliotheken ebenfalls eine Ressource darstellen Ebenso konnen abstrakte Konzepte wie Operatoren und Operanden einer mathematischen Gleichung Arten einer Beziehung z B Elter oder Angestellter oder Zahlen z B Null Eins und Unendlich eine Ressource sein RFC 3986 Abschnitt 1 1 5 Aufbau BearbeitenNach dem aktuellen Standard RFC 3986 1 besteht ein URI aus funf Teilen scheme Schema oder Protokoll authority Anbieter oder Server path Pfad query Abfrage und fragment Teil wovon nur scheme und path in jedem URI vorhanden sein mussen Die generische Syntax ist URI scheme hier part query fragment Dabei steht hier part hierarchischer Teil fur eine optionale authority und den path Ist die Angabe einer authority erforderlich um die Ressource letztlich zu verorten so wird sie durch doppelten Schragstrich eingeleitet und die darauf folgende Pfadangabe muss mit einem Schragstrich beginnen Der Standard verdeutlicht diese Komponenten mit zwei Beispielen foo example com 8042 over there name ferret nose scheme authority path query fragment urn example animal ferret nose Schema Scheme Bearbeiten Das Schema der Teil vor dem Doppelpunkt definiert den Kontext und bezeichnet so den Typ des URIs was die Interpretation des folgenden Teils festlegt Bekannte Schemata sind beispielsweise die Protokolle a href Hypertext Transfer Protocol html title Hypertext Transfer Protocol http a und a href File Transfer Protocol html title File Transfer Protocol ftp a sowie Notationskonzepte wie a href Uniform Resource Name html title Uniform Resource Name urn a und a href Digital Object Identifier html title Digital Object Identifier doi a Mit dem Doppelpunkt endet der erste obligatorische Teil des URI Gibt es keinen Bezug auf eine die Namensverwaltung organisierende aktive Autoritat so folgt direkt auf diesen Doppelpunkt der Pfad zur Verortung der Ressource Authority im Sinne von Zustandigkeit Bearbeiten Viele URI Schemata wie http oder ftp haben einen authority Teil Der Begriff authority bezieht sich auf eine Instanz die die Namen in diesem vom Schema angegebenen Interpretations Raum zentral verwalten kann Ein Beispiel dafur ist das Domain Name System das von globalen und lokalen Registraren verwaltet wird Die authority besteht aus einer optionalen Benutzerinformation gefolgt von einem dem Host und einer optionalen durch einen Doppelpunkt eingeleiteten Port Angabe Sie folgt auf zwei Schragstriche und wird von einem einfachen Schragstrich einem Fragezeichen einem Doppelkreuz oder dem Ende des URIs begrenzt Der Host Teil kann aus einer IP Adresse einer IPv6 Adresse in eckigen Klammern oder einem registrierten Namen bestehen Gultige Werte sind beispielsweise de wikipedia org user example com 8080 192 0 2 16 80 2001 db8 7 Die mogliche Angabe von Benutzername und Kennwort in der Benutzerinformation user password wird in RFC 3986 Abschnitt 3 2 1 6 als uberholt bezeichnet und sollte nicht mehr verwendet werden da URIs oft im Klartext ubertragen und protokolliert werden Pfad Path Bearbeiten Der Pfad enthalt oft hierarchisch organisierte Angaben die zusammen mit dem Abfrageteil eine Ressource identifizieren Falls in der URI eine im vorangegangenen Abschnitt beschriebene authority angegeben wurde muss der path mit einem Schragstrich beginnen gibt es keine authority darf der path nicht mit einem doppelten Schragstrich beginnen Dadurch ist die eindeutige Interpretation gesichert Er wird von einem Fragezeichen einem Doppelkreuz oder dem Ende des URI begrenzt Gultige Pfade sind beispielsweise over there example animal ferret noseAbfrage Query Bearbeiten Der Abfrageteil Query String beinhaltet Daten zur Identifizierung von solchen Ressourcen deren Ort durch die Pfadangabe allein nicht genau angegeben werden kann Sie mussen aus der durch den Pfad bezeichneten Quelle durch ebendiese Abfrage wie ein Datensatz aus einer Datenbank abgerufen werden Er wird mit einem Fragezeichen eingeleitet und von einem Doppelkreuz oder dem Ende des URI begrenzt Eine gultige Abfrage nach dem ist beispielsweise title Uniform Resource Identifier amp action submitHier spielen amp und etwa die gleiche Rolle wie und im Teil fur die authority Fragment Bearbeiten fragment ist der optionale Fragmentbezeichner und referenziert eine Stelle innerhalb einer Ressource Der Fragmentbezeichner bezieht sich immer nur auf den unmittelbar vorangehenden Teil des URI und wird von einem Doppelkreuz eingeleitet Ein Beispiel dafur ist der Anker in HTML Beispiele Bearbeiten https de wikipedia org wiki Uniform Resource Identifier ftp ftp is co za rfc rfc1808 txt file C Users Benutzer Desktop Uniform 20Resource 20Identifier html file etc fstab geo 48 33 14 122 u 22 5 ldap 2001 db8 7 c GB objectClass one gopher gopher floodgap com mailto John Doe example com sip 911 pbx mycompany com news comp infosystems www servers unix data text plain charset iso 8859 7 be fa be tel 1 816 555 1212 telnet 192 0 2 16 80 urn oasis names specification docbook dtd xml 4 1 2 git github com rails rails git crid broadcaster com movies BestActionMovieEverEin Beispiel mit sehr vielen Elementen gleichzeitig in der URI http nobody password example org 8080 cgi bin script php action submit amp pageid 86392001 section 2URI Referenzen BearbeitenOft verwenden Anwendungen nicht den vollstandigen URI sondern eine abgekurzte Syntax beispielsweise um Platz zu sparen oder den einfachen Umzug auf andere Server zu ermoglichen Manche URI Schemata begrenzen in ihrer Definition zudem die Syntax auf eine bestimmte Form Unter dem Begriff der URI Referenzen werden unterschiedliche Schreibweisen zusammengefasst Absolute URIs Bearbeiten Ein absoluter URI identifiziert eine Ressource unabhangig vom Kontext der Verwendung des URI 7 Er besteht mindestens aus scheme und hier part also einer authority und oder einem path Beispiele sind https de wikipedia org file localhost var spool dump binRelative Referenz Bearbeiten Im Gegensatz zu einem absoluten URI beschreibt ein relativer URI nur die Abweichung zwischen dem absoluten URI einer Ressource und dem aktuellen Kontext in einem hierarchischen Namensraum 7 8 Wenn eine URI Referenz nicht mit einem scheme beginnt wird angenommen dass es sich um eine relative Referenz handelt Die Auflosung einer relativen Referenz zu einem absoluten URI erfolgt abhangig vom Kontext nach standardisierten Regeln Eine relative Referenz besteht aus einem path sowie optional aus query und fragment Es werden drei Arten von relativen Referenzen unterschieden Beginnt der Pfad ohne Schragstrich handelt es sich um eine relative Pfad Referenz beispielsweise image png image png und images image png Beginnt der Pfad mit einem einzelnen Schragstrich handelt es sich um eine absolute Pfad Referenz Beginnt der Pfad mit doppelten Schragstrichen handelt es sich um eine Netzwerk Pfad Referenz Referenz innerhalb desselben Dokumentes Bearbeiten URI Referenzen konnen auf dasselbe Dokument verweisen dessen Teil sie sind Die haufigste Anwendung ist das Doppelkreuz gefolgt von einem Fragment Bezeichner Suffix Referenzen Bearbeiten Weit verbreitet ist die Angabe von URI Referenzen des Internets ohne Bezeichnung des Protokolls des Schemas etwa www wikipedia de Unter der Annahme dass sich aus dem Suffix im Beispiel www DNS Namen werden von rechts nach links aufgebaut auf das Protokoll hier http schliessen lasst funktioniert die Auflosung solcher Referenzen Allerdings ist diese Auflosung von entsprechenden Annahmen und zudem von der jeweiligen Software abhangig Deshalb sollten Suffix Referenzen vermieden werden Schemata BearbeitenUnter anderem sind folgende Schemata definiert Schema Beschreibungcrid Content Reference Identifier fur Fernsehsendungen data Data URL direkt eingebettete Datenfile Dateien im lokalen Dateisystemftp File Transfer Protocolgeo Geografische Koordinatengopher Gopherhttp Hypertext Transfer Protocolldap Lightweight Directory Access Protocolmailto E Mail Adressenews Newsgroup oder Newsartikelpop Mailboxzugriff uber POP3rsync Synchronisation von Daten mit rsyncsip SIP gestutzter Sitzungsaufbau z B fur IP Telefonietel Telefonnummertelnet Telneturn Uniform Resource Names URNs ws WebSocketwssxmpp Extensible Messaging and Presence Protocol fur Jabber IdentifierAuf der Website der Internet Assigned Numbers Authority IANA befindet sich eine vollstandige Liste der offiziellen Schemata 9 Daneben haben sich einige inoffizielle von der IANA auch als vorlaufig bezeichnete Schemata fur einzelne Anwendungen oder gangige Protokolle etabliert Schema Beschreibungabout browserinterne Informationen 10 afp Apple Filing Protocol 11 apt Advanced Packaging Toolcallto Telefonnummern u a Skype und NetMeeting coffee Hyper Text Coffee Pot Control Protocoldaap Digital Audio Access Protocoldoi Digital Object Identifiered2k ED2k URI Schema von eDonkey2000 Kademliafeed Web Feedsfinger Finger 12 fish Files transferred over Shell protocolgit Gitirc ircs Internet Relay Chat 13 itunes iTunesjavascript Ausfuhrung von JavaScript Code 14 lastfm Last fmmagnet Magnet Linkmms Microsoft Media Serverrtmp Real Time Messaging Protocolsftp SSH File Transfer Protocol 15 16 skype Telefonnummern nur Skype smb Server Message Block 17 ssh Secure Shell 18 16 svn svn ssh Apache Subversionview source Quelltextanzeige fur eine Webseite 19 webcal iCalendarwyciwyg What You Cache Is What You Get Firefox interne Anzeige fur die Darstellung gecachter Inhalteymsgr Yahoo MessengerUnterarten BearbeitenEs werden folgende Unterarten von URIs unterschieden Uniform Resource Locator URL Benennen eine Ressource uber ihren primaren Zugriffsmechanismus wie a href Hypertext Transfer Protocol html title Hypertext Transfer Protocol http a oder a href File Transfer Protocol html title File Transfer Protocol ftp a Danach folgt die Bezeichnung des Ortes englisch location der Ressource im Netz meistens der Domain Name URLs waren ursprunglich die einzige Art von URIs weshalb der Begriff URL oft gleichbedeutend mit URI verwendet wird Uniform Resource Name URN Mit dem URI Schema urn oder ggf anderer eine Ressource identifizieren mittels eines vorhandenen oder frei zu vergebenden Namens beispielsweise a href Internationale Standardbuchnummer html title Internationale Standardbuchnummer urn isbn a oder a href SHA 1 html class mw redirect title SHA 1 urn sha1 a Ursprunglich sollte jeder URI in eine dieser beiden Klassen oder weitere noch zu definierende eingeteilt werden Diese strenge Aufteilung wurde jedoch aufgegeben da sie unnotig ist und einige Schemata wie data oder das fruher den URLs zugeordnete a href Mailto html title Mailto mailto a in keine der beiden Klassen passen Siehe auch BearbeitenDigital Object Identifier DOI Persistent Uniform Resource Locator PURL Internationalized Resource Identifier IRI Weblinks BearbeitenRFC 1630 Universal Resource Identifiers in WWW 1994 Informational englisch RFC 3986 Uniform Resource Identifier URI Generic Syntax Januar 2005 Standard englisch RFC 8820 URI Design and Ownership Juni 2020 Standard BCP englisch Web Naming and Addressing W3C englisch Uniform Resource Identifier URI Schemes Internet Assigned Numbers Authority IANA Liste der URI Schemata englisch Tim Berners Lee Cool URIs Don t Change W3C englisch Einzelnachweise Bearbeiten a b c RFC 3986 Uniform Resource Identifier URI Generic Syntax Januar 2005 Standard STD 66 Standard englisch a b RFC 1630 Universal Resource Identifiers in WWW 1994 Informational englisch RFC 1738 Uniform Resource Locators URL Dezember 1994 englisch RFC 2396 Uniform Resource Identifiers URI Generic Syntax April 1998 Abschnitt 1 1 englisch RFC 3986 Uniform Resource Identifier URI Generic Syntax Januar 2005 Abschnitt 1 1 Overview of URIs englisch RFC 3986 Uniform Resource Identifier URI Generic Syntax Januar 2005 Abschnitt 3 2 1 User Information englisch a b RFC 2396 Uniform Resource Identifiers URI Generic Syntax April 1998 englisch RFC 2396 englisch Graham Klyne Uniform Resource Identifier URI Schemes Internet Assigned Numbers Authority IANA 20 Marz 2016 abgerufen am 8 April 2016 englisch tools ietf org tools ietf org tools ietf org tools ietf org tools ietf org iana org a b tools ietf org tools ietf org iana org msdn microsoft com Abgerufen von https de wikipedia org w index php title Uniform Resource Identifier amp oldid 235908849