www.wikidata.de-de.nina.az
Als Textgenerierung auch naturlichsprachliche Generierung englisch Natural Language Generation NLG bezeichnet man die automatische Produktion von naturlicher Sprache durch eine Maschine Die Generierung von Texten ist sowohl ein Teilbereich der Computerlinguistik als auch der kunstlichen Intelligenz 1 Inhaltsverzeichnis 1 Generierungsprozess 2 Anwendungsgebiete 2 1 Roboterjournalismus 2 2 Chatbots 2 3 Content Marketing 2 4 Kunst und Kreativitat 2 5 Phrasendreschmaschinen 3 Geschichte 4 Literatur 5 EinzelnachweiseGenerierungsprozess BearbeitenBeim Generierungsprozess konnen sowohl anhand unterschiedlicher Eingabeformate als auch nach unterschiedlichen technischen Herangehensweise klassifiziert werden Basierend auf dem Format der Daten die der Textgenerierung zugrunde liegen wird unterschieden zwischen 2 Daten zu Text Textgenerierung basierend auf strukturierten Daten zum Beispiel Generierung von Wetterberichten Bilder zu Text Textgenerierung basierend auf Bildern oder Videos zum Beispiel Generierung von Bildunterschriften Text zu Text Textgenerierung basierend auf Texten zum Beispiel Generierung von Ubersetzungen Wahrend die klassische Definition der Textgenerierung noch eine nicht linguistische Quelle als Eingabe vorsah 1 also die Text zu Text Generierung ausschloss ist die Generierung basierend auf Texten wie bei der Ubersetzung oder der Vereinfachung von Texten inzwischen fester Bestandteil des Feldes 2 Auf technischer Ebene wird insbesondere zwischen Pipeline und End to end Architekturen unterschieden Pipeline Architekturen bestehen dabei aus einzelnen meist regelbasierten Komponenten die die Textgenerierung schrittweise vollfuhren Nach Reiter und Dale 1 sind die Schritte zur Textgenerierung Inhaltsbestimmung Entscheidung welche Information im zu generierenden Text enthalten sein sollen Dokumentenstrukturierung Organisation der Struktur in der die Informationen ubertragen werden sollen Aggregation Zusammenfuhrung ahnlicher Satze um die Lesbarkeit und Naturlichkeit des Textes zu verbessern Lexikalische Wahl Wahl der konkreten Worte um eine Information zu kommunizieren Referenzgenerierung Generierung von Koreferenzen innerhalb des Textes Realisierung Tatsachliche Generierung des Textes basieren auf der Syntax Morphologie und Orthographie der Zielsprache Moderne Systeme zur Textgenerierung insbesondere in der Forschung 3 verwenden heute haufig End to end Architekturen Hierbei werden Modelle des Maschinellen Lernens auf grossen Datensatzen bestehend aus Eingabedaten zum Beispiel strukturierte Daten und korrespondierenden haufig menschlich verfassten Texten trainiert Anwendungsgebiete BearbeitenRoboterjournalismus Bearbeiten Unter dem medial gepragten Begriff Roboterjournalismus werden Algorithmen verstanden die aus Datenbanken und kolonnen fertige Nachrichtentexte generieren konnen Bei diesem Verfahren steht die Einsparung bzw Fokussierung humaner Journalisten im Vordergrund Redaktionen konnen durch die maschinelle Entlastung einerseits mit weniger Mitarbeitern hoherwertige weil aufwandiger recherchierte Nachrichtenprodukte gewinnen Andererseits konnen sie Berichte veroffentlichen die aus Mangel an Zeit oder wegen zu wenig Interessenten nicht geschrieben werden konnten Der Einsatz von Software im Journalismus ist noch umstritten es wird vor allem diskutiert worin der menschliche Journalist der Software uberlegen ist 4 Zudem ist die Frage ungeklart inwiefern automatisch generierte Texte dem Urheberrecht unterliegen 5 Die speziell auf die Inputdaten zugeschnittenen Algorithmen berechnen permanent Werte und verfassen Berichte uber diese entweder in bestimmten Zeitintervallen z B tagliche Wetterberichte oder wenn sich Werte stark verandern z B Erdbeben Warnung 6 Besonders haufige Einsatzgebiete von Roboterjournalisten sind zum Beispiel Sportmeldungen 7 Wetterberichte und Borsenticker 8 Aber auch die datengetriebene Erstellung von automatisierten Inhalten fur die Berichterstattung zu lokalen Themen kommt bereits zur Anwendung 9 Chatbots Bearbeiten In textbasierten Dialogsystemen wie Chatbots wird die Textgenerierung zur Kommunikation mit dem Nutzer verwendet Bekanntes historisches Beispiel ist das Programm ELIZA 10 Ein Teil der Kommunikation mit hochentwickelten Intelligenten virtuellen Agenten beruht auf diesem Prinzip wobei die Qualitat des Dialogs unter anderem von der Verknupfung des Agenten mit Wissensbasen abhangt Der Dialog eines Menschen mit verschiedenen Schnittstellen kann erleichtert werden wenn ein Agent Text generiert der Fragen produktiv beantwortet Beim Abrufen eines Informationsangebots unter anderem als Prasentationsagent einer Webseite auch Online Moderator genannt Bei einem sprachfahigen Programm zur Wahl eines Beraters oft fur telefonisches Vorsortieren von Kunden genutzt Bei Dialogen mit Figuren in ComputerspielenContent Marketing Bearbeiten Laut einer Studie ist die Marketing Branche die Branche auf die Kunstliche Intelligenz den grossten Einfluss haben wird 11 Im Marketing werden verschiedene Tools genutzt um Inhalte zu generieren wie z B das Erstellen von Werbetexten die Generierung von Newsletter Betreffzeilen und das Validieren von den KI generierten Ergebnissen Laut einer Umfrage des Digitalverbandes Bitkom Anfang 2023 plant jedes sechste Unternehmen den KI Einsatz zur Textgenerierung 12 Kunst und Kreativitat Bearbeiten Eingriffe in die generierende Software oder die Wissensbasis kunstlerische und literarische Experimente Beispiel nach Reinhard Dohl Max Bense und seine Stuttgarter Gruppe benutzten 1959 eine Zuse Z22 um mit Hilfe eines eingegebenen Lexikons und einer Anzahl von syntaktischen Regeln Texte zu synthetisieren und auszugeben 13 Nachbearbeitung oder Einbau generierten Textes durch Autoren Literatur 14 Dialog mit Publikum beispielsweise in Kunstinstallationen Beispiel David Link Poetry Machine 15 Phrasendreschmaschinen Bearbeiten nbsp BULLSHIT Phrasen StempelPhrasendreschmaschinen oder Bullshit Generatoren englisch bullshit generators auch buzzword generators gab es vor der Umsetzung in Software als mechanische Gerate Wahrscheinlich die erste als Software ausgefuhrte Phrasendreschmaschine war LoveLetters 1 0 1952 programmiert von Christopher Strachey an der University of Manchester fur den Ferranti Mark I 16 Ahnliche Generatoren sind in vielen weiter entwickelten Ausfuhrungen im WWW zu finden Solche Programme arbeiten nach einfachen Konzepten die bei anspruchsvolleren Verfahren der Textgenerierung komplexer ausgestaltet angewandt werden Begriffe oder Satzteile werden aus Listen entnommen aneinandergereiht und grammatikalisch korrekt angepasst grammatische Realisierung Ein dafur oft angewendetes Verfahren ist die Generierung mit Markow Ketten 17 Es entsteht syntaktisch korrekter Text der sinnhaltig wirken kann tatsachlich aber Blodsinn englisch bullshit ist weil Phrasendreschmaschinen nicht auf Wissen uber die Bedeutung verwendeter Partikel zugreifen So lasst sich scherzhaft beispielsweise leere Rhetorik von Fachliteratur persiflieren Geschichte BearbeitenAbgesehen von mechanischen Phrasendreschmaschinen als Vorlaufern und abgesehen von fruhesten Versuchen Texte durch Software zu generieren beginnt die erste Phase naturlichsprachiger Generierung mit Programmen die zur Textgenerierung schematisch auf Wissen zugreifen das bereits in Textform abgelegt ist So funktionierte ab 1963 BASEBALL ein Interface zu den Baseballdaten der amerikanischen Baseballiga und SAD SAM ein Interface zur Eingabe von Verwandtschaftsbeziehungen das bereits auf Fragen antwortete Nach mehreren anderen Arbeiten in dieser Richtung erschien 1966 ELIZA programmiert von Joseph Weizenbaum In der zweiten Phase ist das Wissen in Fakten und Regeln kodiert LUNAR 1972 ist das Interface zur Datenbank uber die Mondprobensammlung der Apollo 11 Mission PARRY 1975 simuliert einen Paranoiden im Gesprach mit einem Psychiater ROBOT 1977 ist das erste kommerzielle Frage Antwort System VIE LANG 1982 von Ernst Buchberger ist ein Dialogsystem in deutscher Sprache das Satze aus einem semantischen Netz generiert 18 HAM ANS 1983 von Wolfgang Hoeppner ist ein Dialogsystem in deutscher Sprache das beispielsweise einen Hotelmanager simuliert 19 Literatur BearbeitenEhud Reiter Robert Dale Building natural language generation systems Cambridge University Press Cambridge 2000 ISBN 0 521 62036 8 Helmut Horacek Textgenerierung in Kai Uwe Carstensen Ralf Klabunde et al Hrsg Computerlinguistik und Sprachtechnologie Heidelberg Spektrum Akademischer Verlag 3 Auflage 2010 ISBN 978 3827420237 S 436 465 John Bateman Angewandte naturlichsprachliche Generierungs und Auskunftsysteme in Ralf Klabunde et al Hrsg Computerlinguistik und Sprachtechnologie s o Heidelberg 2010 S 633 641 Rico Schwank Analyse von Konzepten und Methoden zur Generierung von naturlichsprachlichen Texten aus formalen Daten Diplomarbeit Otto von Guericke Universitat Magdeburg Fakultat fur Informatik 20 Patrick Reichelt Einfuhrung in den Roboterjournalismus Bedrohung oder Chance Tectum Wissenschaftsverlag Baden Baden 2017 ISBN 978 3828840591 Stefan Weber Roboterjournalismus Chatbots amp Co Wie Algorithmen Inhalte produzieren und unser Denken beeinflussen Heise Medien Hannover 2018 ISBN 978 3957881045 Einzelnachweise Bearbeiten a b c Ehud Reiter Robert Dale Building applied natural language generation systems In Natural Language Engineering 3 Jahrgang Nr 1 Marz 1997 ISSN 1469 8110 S 57 87 doi 10 1017 S1351324997001502 englisch cambridge org a b Gatt A Krahmer E Survey of the state of the art in natural language generation Core tasks applications and evaluation In Journal of Artificial Intelligence Research 61 Jahrgang Nr 61 2018 S 65 170 doi 10 1613 jair 5477 arxiv 1703 09902 englisch E2E NLG Challenge Abgerufen im 1 Januar 1 Archivierte Kopie Memento des Originals vom 29 Oktober 2014 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www text gold de abgerufen am 29 Oktober 2014 Von Computern autonom geschaffene Werke Urheberrechtlich schutzenswert Abgerufen am 8 November 2018 Julian Maitra Medien Die Roboterjournalisten sind schon unter uns In welt de 15 Mai 2014 abgerufen am 7 Oktober 2018 Cecile Schneider und Uli Koppen Wie Textautomatisierung BR Sport unterstutzt BR24 17 Februar 2021 abgerufen am 10 Februar 2023 Andreas Graefe Guide to Automated Journalism Columbia Journalism Review New York City 2016 cjr org abgerufen am 14 Februar 2018 Roboterjournalisten retten die Lokalpresse Wer rettet uns davor Abgerufen am 20 November 2018 deutsch Josef Karner Mailufterl Al Chorezmi und Kunstliche Intelligenz Ein Gesprach mit dem Computerpionier Heinz Zemanek Telepolis 8 August 1999 S 1 archiviert vom Original am 22 Januar 2005 abgerufen am 20 Marz 2010 Frage 20 ff Weizenbaum hat aber nicht Intelligenz oder gar Bewusstsein erschaffen sondern gezeigt mit welch einfachen Mitteln man einen Betrachter glauben machen kann er hatte es mit Intelligenz zu tun Sizing the potential value of AI and advanced analytics McKinsey Abgerufen am 26 Mai 2021 Andreas Streim Merle Uhl ChatGPT amp Co Jedes sechste Unternehmen plant KI Einsatz zur Textgenerierung In bitkom org 11 April 2023 abgerufen am 7 Mai 2023 Reinhard Doehl Der Kreis um Max Bense Abgerufen am 16 Marz 2010 Abteilung Kunstliche Poesie Abschnitt 5 Reinhard Doehl Der Kreis um Max Bense Abgerufen am 16 Marz 2010 Abteilung Kunstliche Poesie Abschnitt 6 Miriam Sturner David Link Poetry Machine version 1 0 2001 2002 Nicht mehr online verfugbar ZKM Zentrum fur Kunst und Medientechnologie Karlsruhe archiviert vom Original am 20 November 2010 abgerufen am 15 Marz 2010 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www zkm de David Link LoveLetters 1 0 MUC Resurrection A Memorial Nicht mehr online verfugbar Archiviert vom Original am 28 Marz 2010 abgerufen am 15 Marz 2010 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www alpha60 de Andreas Stuhlmuller Texten mit Markov Nicht mehr online verfugbar 14 Februar 2005 archiviert vom Original am 17 Juni 2010 abgerufen am 24 Marz 2010 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www aiplayground org VIE GEN NLG Systems Wiki 17 November 2009 abgerufen am 15 Marz 2010 englisch Jorg Roth Einfuhrung in naturlichsprachliche Textgenerierung 1989 abgerufen am 14 Marz 2010 Rico Schwank Analyse von Methoden zur Generierung naturlichsprachlicher Texte aus formalen Daten Nicht mehr online verfugbar Otto von Guericke Universitat Magdeburg archiviert vom Original am 1 September 2010 abgerufen am 13 Marz 2010 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot wdok cs uni magdeburg de Abgerufen von https de wikipedia org w index php title Textgenerierung amp oldid 235384958