www.wikidata.de-de.nina.az
VoiceXML Voice Extensible Markup Language ist eine XML Applikation die der Beschreibung von Dialog Ablaufen in einem Sprachdialogsystem dient Sie ist besonders fur Telefonanwendungen entwickelt worden Seit Juni 2007 ist die aktuelle Version VoiceXML 2 1 eine Empfehlung des World Wide Web Consortiums W3C und hat damit denselben Status als Web Standard wie HTML Anwendungen die in VoiceXML entwickelt wurden laufen somit auf jeder VoiceXML kompatiblen Sprachplattform Auf Grund der Analogie zum HTML Web Browser werden VoiceXML Interpreter auch als Voicebrowser bezeichnet 1 Als Erweiterung grafischer Benutzerschnittstellen im World Wide Web um die Ein und Ausgabemoglichkeit durch naturliche Sprache hin zu multimodalen Benutzerschnittstellen haben sich weitere Dialogbeschreibungssprachen als Erganzung oder Alternative zu VoiceXML entwickelt SALT Speech Application Language Tags X V XHTML Voice Web Speech APISALT wurde von Microsoft initiiert und dient der starkeren Verknupfung von Sprachanwendungen mit den Inhalten und Verfahrensweisen des World Wide Web X V verbindet XHTML und VoiceXML Elemente um Internet und Telefonie zu verschmelzen Die Web Speech API ermoglicht die ECMAScript gesteuerte Erweiterung von Webseiten um Sprachein und Ausgabe Inhaltsverzeichnis 1 Entwicklungsgeschichte 2 Analogien zum World Wide Web 3 Grenzen 4 Siehe auch 5 Weblinks 6 EinzelnachweiseEntwicklungsgeschichte BearbeitenBei den ersten Sprachanwendungen gab es keine Trennung von Anwendung und Plattform Dialogverlaufe wurden genauso hart verdrahtet programmiert und kompiliert wie beispielsweise die Schnittstellen zur Telefonanlage Das hatte den Vorteil dass Sprachanwendungen in der Regel schnell erstellt werden konnten und zuverlassig liefen aber eine fur heutige Begriffe unakzeptable Starrheit aufwiesen Sollte beispielsweise ein Dialog geandert werden musste der Anwendungsprogrammierer Eingriffe tief im Quellcode vornehmen In neueren Sprachanwendungen wurde deshalb die Anwendung von der Plattform getrennt um Dialoge einfacher pflegen zu konnen Skriptsprachen oder Tools zur Beschreibung dieser Anwendungen waren und sind es zum Teil auch noch heute proprietar also von Anbieter zu Anbieter unterschiedlich VoiceXML 2 0 ist eine Standardisierungsanstrengung des W3C mit dem Ziel zu einer einheitlichen Beschreibung von Sprachanwendungen zu kommen Gleichzeitig ist es eine Schnittstellensprache die zur Kommunikation zwischen Anwendung und Plattform genutzt werden kann Der Standard hat mittlerweile eine weite Verbreitung gefunden und wird von zahlreichen Anbietern unterstutzt Neben den im Markt nach wie vor sehr verbreiteten proprietaren Losungen und Anwendungsplattformen gibt es konkurrierende Standardisierungsansatze insbesondere den von einem Konsortium um Microsoft vorangetriebenen SALT Standard Die Spezifikation wurde am 16 Marz 2004 veroffentlicht VoiceXML 2 1 wurde am 19 Juli 2007 veroffentlicht und erweitert die Version 2 0 um einige zusatzliche Fahigkeiten Diese sollen die wahrend der Arbeit mit VoiceXML 2 0 erkannten Unzulanglichkeiten ausgleichen Die Version 2 1 ist dabei vollstandig abwartskompatibel zu Version 2 0 Aktuell wird an der Spezifikation zu VoiceXML 3 0 gearbeitet Diese Version soll ein vollstandiges Redesign der Spezifikation mit sich bringen um eine Nutzung als Domain Specific Language fur die Entwicklung von Sprachschnittstellen auch abseits der Telefonie zu ermoglichen Die Abwartskompatibilitat zu VoiceXML 2 1 soll durch ein spezielles Profil ermoglicht werden Analogien zum World Wide Web BearbeitenVergleicht man VoiceXML mit HTML dann gibt es eine Reihe von Parallelen Wie HTML ist VoiceXML sowohl Beschreibungssprache als auch Schnittstellenstandard Man kann VoiceXML direkt nutzen um Sprachanwendungen zu codieren genauso wie man HTML direkt nutzen kann um Benutzeroberflachen zu codieren Man kann die Anwendung aber auch mit einem proprietaren Tool definieren und daraus dynamisch oder statisch VoiceXML Code generieren Das entspricht der Verwendung eines Dokumentenmanagementsystems fur die Pflege einer Webseite VoiceXML wird in diesem Fall weitgehend auf seine Eigenschaft als Schnittstellenstandard reduziert Die Analogie hinkt allerdings beim heutigen Stand der Technik noch an einem wichtigen Punkt Noch sitzt der VoiceXML Browser als Bestandteil der Plattform nicht direkt im Telefon des Endkunden sondern steht haufig aus Effizienzgrunden sogar noch im gleichen Serverraum wie der Anwendungs Server Die Kommunikation zwischen Anrufer und Plattform geschieht uber das offentliche Telefonnetz Damit ist fur den Anrufer und oft auch fur den Betreiber die Frage ohne grosse Bedeutung uber welchen Standard Plattform und Applikation kommunizieren Erst wenn aufgrund gestiegener Rechenleistung der Browser und mit ihm zusammen insbesondere der Spracherkenner und die Sprachsynthese auf dem Telefon Platz findet ist die Frage der Standardisierung fur den Anrufer genauer den Nutzer der Sprachapplikation von wirklicher Bedeutung Die Situation ist also heute noch in gewisser Weise vergleichbar mit der Frage ob eine Benutzeroberflache fur eine lokal betriebene Anwendung in der Sprache HTML oder etwa in Visual Basic oder auch mit einem proprietaren Tool zur GUI Erstellung realisiert werden soll entscheidend ist vor allem die Qualitat der resultierenden Benutzeroberflache Grenzen BearbeitenDer Funktionsumfang des VoiceXML Standards ist ein Kompromiss Das bedeutet dass erwunschte Features moglicherweise nicht oder erst in einer spateren Version unterstutzt werden In diesem Fall kann VoiceXML jedoch durch proprietare Erganzungen ausgeweitet werden Das verwassert die oben erwahnten Vorteile zwar etwas ist jedoch immer noch praktikabler als das gesamte System auf ein proprietares Skript aufzusetzen VoiceXML als Skriptsprache zur Anwendungsentwicklung beruht auf dem Grundkonzept dass sich Dialoge zwischen Mensch und Maschine uber explizit vordefinierte Flussdiagramme formalisieren lassen In dieser Vorstellung navigiert der Anrufer durch den vordefinierten Dialogablauf haufig sogar unter Verwendung expliziter Navigationskommandos wie zuruck und Hauptmenu Dieses Konzept stosst dort an die Grenzen wo sich die Interaktion einem freien Mensch Maschine Dialog annahert bei dem der Anrufer die Dialoginitiative durch das Formulieren ganzer Satze ubernehmen kann z B nein nach Hamburg und zwar so dass ich so gegen 18 Uhr da bin sogenannte conversational oder mixed initiative dialogues Zwar gibt es Konstrukte in VoiceXML die dem Anrufer bei der Navigation durch den Dialogablauf gewisse Freiheiten eroffnen z B sogenanntes form filling der Aufwand fur die Anwendungsentwicklung steigt jedoch prinzipbedingt mit zunehmender Freiheit im Dialogablauf drastisch an Fur die Realisierung solcher Dialoge erweist sich die Einfuhrung eines sogenannten Dialogmanagers als nutzlich der die Systemreaktion dynamisch auf Basis der Dialoghistorie bestimmt Ein solcher Dialogmanager kann genutzt werden um VoiceXML Dokumente als Schnittstelle zur Sprachplattform dynamisch zu generieren Multimodale Anwendungen also die Verbindung von Sprache und grafischer Ausgabe werden derzeit von VoiceXML nur begrenzt unterstutzt Es gibt jedoch Tendenzen multimedial angelegte Dialogbeschreibungssprachen zu etablieren Dabei stellt X V XHTML Voice den Versuch da VoiceXML mit XHTML mithilfe von speziellen Synchronisierungselementen zusammenzufuhren Ein weiterer Ansatz bietet die Sprache SALT die als Aufsatz auf HTML gedacht ist aber fur die Sprachfunktionen auf einen proprietaren von VoiceXML verschiedenen Ansatz setzt Bisher haben diese technischen Losungen aber noch das Hauptproblem dass ein uberzeugender Use Case fur ihren praktischen Einsatz fehlt Siehe auch BearbeitenSprachdialogsystem Dialog Design Gestaltung akustischer Benutzerschnittstellen Text to Speech TTS siehe Sprachsynthese Naturliche Sprache Natural Language Understanding NLU Verstehen naturlicher Sprache Unified Messaging IP TelefonieWeblinks BearbeitenW3C Spezifikation von Voice XML 2 0 W3C Spezifikation von Voice XML 2 1 W3C Spezifikation von Voice XML 3 0 Einfuhrung in VoiceXML 2 0 deutsche Ubersetzung voice compass Fachbuch uber Sprachanwendungen und Portal fur Herstellerubersichten zum Thema Voice und SprachautomationEinzelnachweise Bearbeiten https www w3 org VoiceV DStandards des World Wide Web Consortiums W3C Empfehlungen ActivityPub ARIA Canonical XML CDF CSS DOM Geolocation API HTML HTML5 InkML ITS JSON LD MathML OWL P3P PLS PNG RDF RDF Schema RIF SCXML SISR SKOS SMIL SOAP SRGS SSML SVG SPARQL Timed Text Turtle VoiceXML WSDL XForms XHTML XHTML RDFa XInclude XLink XML XML Base XML Encryption XML Events XML Information Set XML Namespace XML Schema XML Signature XPath XPointer XProc XQuery XSL XSL FO XSLT Elemente nbsp Arbeitsentwurfeund Kandidaten CCXML CURIE SMIL Timesheets sXBL WICD XFrames XBL XHTML MathML SVG XMLHttpRequestAnmerkungen XAdES XFDL XHTML SMIL XUPRichtlinien Web Content Accessibility Guidelines Multimodal Interaction Activity Markup Validation ServiceInitiativen Web Accessibility Initiative Abgerufen von https de wikipedia org w index php title VoiceXML amp oldid 224449409