www.wikidata.de-de.nina.az
Ubersetzungsprogramm ist eine Weiterleitung auf diesen Artikel Siehe auch Ubersetzungsforderungsprogramm Maschinelle Ubersetzung MU oder MT fur engl machine translation bezeichnet die automatische Ubersetzung von Texten aus einer Sprache in eine andere Sprache durch ein Computerprogramm Wahrend die menschliche Ubersetzung Gegenstand der angewandten Sprachwissenschaft ist wird die maschinelle Ubersetzung als Teilbereich der kunstlichen Intelligenz in der Computerlinguistik erforscht Inhaltsverzeichnis 1 Menschheitstraum 2 Geschichte 3 Ubersetzungs Methoden 3 1 Regelbasierte Methoden 3 1 1 Direkte Maschinenubersetzung 3 1 2 Transfer Methode 3 1 3 Interlingua Methode 3 2 Beispielbasierte MU 3 3 Statistische MU 3 4 Neuronale MU 3 5 MU mit menschlicher Hilfe 3 6 Abgrenzung 4 Qualitat 4 1 Bewertung 4 2 Praktische Probleme 4 3 Grammatische Problemgebiete regelbasierter Methoden 5 Beispiele 6 Siehe auch 7 Literatur 8 Weblinks 9 EinzelnachweiseMenschheitstraum BearbeitenDas Verstehen einer Sprache ohne sie gelernt zu haben ist ein alter Menschheitstraum Turmbau zu Babel J Bechers numerische Interlingua Timerio Babelfisch Pfingstwunder Science Fiction Geschichten Die Erfindung der Computer in Kombination mit der Beschaftigung mit dem Phanomen Sprache als wissenschaftliche Disziplin Sprachwissenschaft hat zum ersten Mal einen konkreten Weg zur Erfullung dieses Traums geoffnet Geschichte BearbeitenBis zum heutigen Tag hat das militarische Interesse den Weg der MU entscheidend gepragt Eines der fruhesten Projekte war ein Russisch Englisch Ubersetzungsprogramm fur das US Militar Trotz seiner anekdotenhaft schlechten Qualitat genoss das Programm hohe Popularitat unter US Militars die sich zum ersten Mal ohne den Umweg uber Dritte Dolmetscher und Ubersetzer selbst zumindest einen Eindruck vom Inhalt russischer Dokumente verschaffen konnten Der 1966 fur das Verteidigungsministerium der Vereinigten Staaten erstellte ALPAC Bericht 1 bescheinigte der MU grundsatzliche Unrealisierbarkeit und brachte mit einem Schlag die Forschung fur fast 20 Jahre praktisch ganz zum Erliegen Erst in den 1980er Jahren begannen Elektrokonzerne wie die Siemens AG Metal Projekt erneut mit der Forschung Zu diesen Vorhaben zahlt auch die Forschungsarbeit im Sonderforschungsbereich Elektronische Sprachforschung an der Universitat des Saarlandes Hier wurde das System SUSY entwickelt das in der Lage war aus dem Deutschen und ins Deutsche zu ubersetzen 2 Ein weiteres System des Sonderforschungsbereichs war ASCOF in dem neben morpho syntaktischen auch semantische Informationen fur die Ubersetzung herangezogen wurden 3 In der gleichen Zeit initiierte die japanische Regierung das Funfte Generation Projekt bei dem MU vom Englischen ins Japanische zunachst auf der Basis der Programmiersprache Prolog implementiert wurde Die enge Zusammenarbeit zwischen Universitaten Elektrokonzernen und Regierung fuhrte zu den weltweit ersten kommerziellen MU Programmen fur PCs und hat Japan in die Fuhrungsposition der MU Forschung weltweit gebracht In den 1990er Jahren lief in Deutschland das BMBF Leitprojekt Verbmobil dessen Ziel es war deutsche englische und japanische gesprochene Dialogsprache zu dolmetschen Das Verbmobil System sollte gesprochene Spontansprache erkennen die Eingabe analysieren ubersetzen einen Satz erzeugen und ihn aussprechen 4 In den 2000er Jahren kamen vermehrt statistische Verfahren zum Einsatz So bietet Google seit 2006 ein statistisches Ubersetzungssystem an 5 Auch regelbasierte Ansatze wurden weiterentwickelt Eines der bekanntesten Forschungsprojekte dieser Art ist die freie Software Apertium die von der spanischen Regierung und der Regierung von Katalonien finanziert und an der Universitat Alicante weiterentwickelt wird Der Stand der MU im Jahr 2010 wurde von vielen Menschen als unbefriedigend bewertet Grundsatzlich versteht die Wissenschaft menschliche Sprache aber noch unzureichend Die meisten Sprachwissenschaftler gingen gar davon aus dass maschineller Ubersetzung ohne uber das reine Sprachverstandnis weit hinausgehende Kompetenzen automatischer Systeme grundsatzliche Grenzen gesetzt sind da viele Ubersetzungen zudem grosse Mengen an konzeptuellem Wissen Metawissen sowie Kenntnisse uber die Konstitution menschlicher Umwelt allgemein und uber die Konventionen sozialer Interaktion erfordern Seit dem Jahr 2016 werden fur Ubersetzungsprogramme zunehmend kunstliche neuronale Netze d h kunstliche Intelligenzen eingesetzt wodurch der Fortschritt rasant zunahm Beispiele sind DeepL Google Ubersetzer Yandex Translate sowie der Bing Translator die fortan deutlich bessere Ergebnisse erzielten 6 Im Marz 2018 teilte Microsoft mit durch eine KI Chinesisch Englisch Ubersetzungen mit der Qualitat eines professionellen menschlichen Ubersetzers zu erreichen Das sei ein Durchbruch bei der maschinellen Ubersetzung den Microsoft nicht so fruh erwartet habe 7 8 Der Bedarf an MU Anwendungen steigt weiter Viele Texte sind heute digital verfugbar also leicht fur den Computer zu verarbeiten Die Globalisierung erfordert die Ubertragung von immer mehr Texten in immer mehr Sprachen der Markt fur Ubersetzung verdoppelt sich alle vier Jahre wahrend die Popularitat des Berufs des Ubersetzers Dolmetschers stagniert Gerade von nur wenigen Westeuropaern Amerikanern gesprochene beziehungsweise fur diese schwierig zu erlernende Sprachen aus Regionen deren Bewohner ihrerseits kaum westliche Sprachen sprechen werden immer wichtiger kommerziell wichtig die ostasiatischen Sprachen Chinesisch Koreanisch und Japanisch sowie Thai militarisch wichtig Sprachen der internationalen Konfliktregionen vor allem mit Beteiligung des US Militars 2003 haben gleich mehrere US Software Unternehmen Ubersetzungsprogramme fur Arabisch und Paschtu eine der Sprachen in Afghanistan und Grenzregionen Pakistans herausgebracht Ebenfalls 2003 hat die DARPA einen Blind Wettbewerb fur eine unbekannte Ausgangssprache durchgefuhrt 2011 wurde das BOLT Programm gestartet das zum Ziel hat die Erforschung der Ubersetzung chinesischer und arabischer Texte ins Englische zu fordern 9 10 Ubersetzungs Methoden BearbeitenRegelbasierte Methoden Bearbeiten Direkte Maschinenubersetzung Bearbeiten Die Worter des Quelltextes werden mit dem Worterbuch Wort fur Wort und in der gleichen Reihenfolge in die Zielsprache ubertragen Anschliessend werden Satzstellung und Flexion nach den Regeln der Zielsprache angepasst Dies ist die alteste und einfachste MU Methode die beispielsweise auch obigem Russisch Englisch System zugrunde lag Transfer Methode Bearbeiten Die Transfer Methode ist die klassische MU Methode mit drei Schritten Analyse Transfer Generierung Der zweite Schritt hat der ganzen Methode den Namen gegeben Zunachst wird die grammatische Struktur des Quelltextes analysiert oft in einer Baumstruktur Abhangig von der gewahlten Transfermethode wird daraus oft eine semantische Struktur abgeleitet Danach werden die Strukturen in die Zielsprache ubertragen transferiert Schliesslich werden in der Zielsprache aus den Strukturen mit grammatischen Regeln wiederum Satze erzeugt und so der Zieltext erzeugt generiert Interlingua Methode Bearbeiten Die Interlingua Methode analysiert zunachst die grammatische Information des Quelltextes und transferiert diesen nach vordefinierten Regeln in eine Zwischensprache Interlingua Die grammatische Information in der Zielsprache wird aus dieser Zwischensprache erzeugt Die Interlingua Methode ist hilfreich bei mehrdeutigen Ausdrucken So kann man deutsch umgangssprachlich Wenn ich arbeiten wurde wurde ich mir ein Auto kaufen hochsprachlich mit Konjunktiv Wenn ich arbeitete kaufte ich mir ein Auto nicht mit einer Transfer Regel wurde would ubersetzen If I would work I would buy a car weil auf Englisch if Satze would nicht erlauben In der Interlingua wurde die wurde Information abstrakt als Irreales Konditional weitergegeben und im Englischen je nach dem Satzkontext mit oder ohne would realisiert Beispielbasierte MU Bearbeiten Example Based Machine Translation EBMT Das Kernstuck eines beispielbasierten MU Systems ist ein Ubersetzungsspeicher in dem haufig wiederkehrende Satze oder Redewendungen mit ihren jeweiligen Ubersetzungen gespeichert werden Statistisch wird mit Information Retrieval Methoden berechnet wie ahnlich alle Eintrage des Ubersetzungsspeichers jeweils einem Satz des Quelltextes sind Aus der Kombination der Ubersetzung der ahnlichsten Satze wird die Ubersetzung generiert Statistische MU Bearbeiten Statistics Based Machine Translation SBMT Vor der eigentlichen Ubersetzung analysiert ein Programm ein moglichst grosses Textkorpus von zweisprachigen Texten oft zum Beispiel Parlamentsprotokolle etwa aus dem kanadischen Hansard Corpus Dabei werden Worter und grammatische Formen in Ausgangs und Zielsprache aufgrund ihrer Haufigkeit und gegenseitigen Nahe einander zugeordnet und somit ein Worterbuch sowie Grammatikubertragungsregeln extrahiert Auf dieser Basis werden die Texte ubersetzt Die statistische MU ist sehr popular weil sie keinerlei Kenntnis der beteiligten Sprachen voraussetzt Deshalb kann die statistische MU durch die Analyse realer Textbestande theoretisch auch solche Regeln erfassen die sprachwissenschaftlich noch nicht genau erklart sind 11 Neuronale MU Bearbeiten Neural Machine Translation NMT Neuronale MU basiert wie statistische MU auf der Analyse von zweisprachigen Texten Diese Texte werden von einem kunstlichen neuronalen Netz angelernt und dabei die Zusammenhange zwischen Ausgangs und Zielsprache erfasst 12 Es kann bei der Ubersetzung allerdings nicht nachvollzogen werden wie das Ergebnis zustande kam 13 obwohl neuronale MU viele Texte praziser als die Konkurrenz zu ubersetzen scheint 14 MU mit menschlicher Hilfe Bearbeiten Human Aided Machine Translation HAMT Bei der MU mit menschlicher Hilfe muss der Benutzer mehrdeutige oder schwierig zu ubersetzende Konstruktionen selbst ubersetzen oder vermeiden Dies kann im Voraus geschehen indem der Benutzer beispielsweise lange Satze in kurze Satze unterteilt oder interaktiv zum Beispiel indem der Benutzer die richtige Bedeutung eines Wortes auswahlt Abgrenzung Bearbeiten Nicht zur maschinellen Ubersetzung zahlt die computerunterstutzte Ubersetzung Machine Aided Human Translation MAHT auch Computer Aided Translation oder CAT genannt bei der ein Computerprogramm den menschlichen Ubersetzer unterstutzt Qualitat BearbeitenBewertung Bearbeiten Die MU Forschung benutzt die Evaluation die skalierte Bewertung der Ubersetzungsqualitat MU Ubersetzungen werden zunachst pro Satz bewertet die normalisierte Summe der Satzbewertungen ist die Qualitat des ganzen Textes In den meisten Fallen wird die Bewertung per Hand von einem Muttersprachler der Zielsprache durchgefuhrt und in einer Kennziffer ausgedruckt In Japan wird oft eine funfstellige Skala mit 0 4 Punkten verwendet 4 Punkte Sehr gut verstandlich bis perfekt kein offensichtlicher Fehler 3 Punkte Ein bis zwei falsche Worter sonst gut verstandlich 2 Punkte Mit gutem Willen kann man sich ungefahr denken was ursprunglich gemeint war 1 Punkt Der Satz wird in einem anderen als dem gemeinten Sinn verstanden wenn uberhaupt Das liegt oft an teilweise falscher oder ganz falscher Grammatik Ubersetzung Struktur 0 Punkte Der Satz ergibt keinen Sinn sieht aus wie eine zufallig zusammengewurfelte chaotische Anordnung von Wortern Fur die automatische Bewertung der Ubersetzungsqualitat verwendet man Algorithmen wie den Bleu Score welche die Ahnlichkeit der automatischen Ubersetzung mit einer menschlichen Referenzubersetzung messen 15 Bleu und andere Evaluationmasse wurden kritisiert weil sie unzuverlassig sind und vor allem auf Satzebene nur bedingt zwischen guten und schlechten Ubersetzungen unterscheiden 16 Trotzdem korrelieren automatische Bewertungsmasse relativ gut mit menschlichen Bewertungen vor allem bei der Bewertung ganzer Textdokumente mit mehreren Tausend Satzen 17 Eine wirksame Bewertungsmethode fur die Qualitat einer maschinellen Vorubersetzung basiert auf der sogenannten Trefferrate Anzahl Terme bezogen auf alle Terme im Dokument welche der Ubersetzer beim manuellen Nachubersetzen unverandert ohne manuelle Eingriffe ubernehmen kann Beugung Position des Satzglieds im Satz des Terms im Satzglied Terme stellen Einzelworter oder fest gefugte Wortgruppen dar Je nach Qualitat lohnt sich die maschinelle Vorubersetzung oder behindert den Ubersetzer Praktische Probleme Bearbeiten Dass MU Qualitat oft als unbefriedigend empfunden wird hat auch noch handfestere teilweise behebbare Ursachen Benutzer kennt Zielsprache Gerade bei Ubersetzungen zwischen westlichen Sprachen versteht der Benutzer oft die Zielsprache bis zu einem gewissen Grad selbst und ist so empfindlicher gegenuber Abweichungen als jemand der ausschliesslich auf die Ubersetzung angewiesen ist Sprachstil Jeder Sprachstil hat Besonderheiten die teilweise noch nicht einmal in der Linguistik beschrieben wurden MU Systeme gehen meist von der geschriebenen Zeitungssprache aus Besonders schlechte Ergebnisse liefern MU Systeme bei den Textarten fur die sie nicht entwickelt wurden also meistens bei literarischen Texten bei gesprochener Sprache oder gelegentlich auch bei technischen Texten Zu kleines oder fehlerhaftes Worterbuch Mit den Veranderungen in Gesellschaft und Wissenschaft nimmt der Wortschatz einer Sprache jeden Tag rasant zu Ausserdem haben viele Worter mehrere Bedeutungen siehe Homonym die durch Kontext Analyse disambiguiert werden konnten Worterbuch Mangel wie im Anfangsbeispiel Russisch Englisch sind zu einem uberraschend grossen Teil fur die schlechte Ubersetzungsqualitat verantwortlich Die grossten MU Programme haben Worterbucher mit mehreren Millionen Eintragen und einem Vielfachen an Bedeutungsunterscheidungen Mangelnde Transfer Regeln Viele grammatische Phanomene unterscheiden sich stark von Sprache zu Sprache bzw sind nur in bestimmten Sprachen vorhanden Die Losung dieser Probleme erfordert oft linguistische Grundlagenforschung diesen Aufwand suchen MU Unternehmen zu vermeiden Computerlinguistische Probleme Daneben hat die MU viele Probleme die auch bei anderen computerlinguistischen Anwendungen auftreten zum Beispiel das Verstandnis von Weltwissen Grammatische Problemgebiete regelbasierter Methoden Bearbeiten In keinem MU System wird jede grammatische Regel angewendet beziehungsweise analysiert Vielmehr wird oft darauf vertraut dass ein nicht analysiertes grammatisches Phanomen zufallig in der anderen Sprache in ahnlicher Form auftritt sodass nur die Worter ubersetzt werden mussen Ein Beispiel ist der Artikel der die das der im Englischen fast immer zu the und fast nie zu a ubersetzt wird Auf eine Analyse als bestimmter Artikel kann also verzichtet werden Dass aber auch zwischen Deutsch und Englisch solche einfachen Ubersetzungen scheitern konnen zeigt der obige if Satz mit wurde Zwischen weniger nahen und nicht verwandten Sprachen zum Beispiel Latein und Deutsch bzw Chinesisch und Deutsch sind solche direkten Ubersetzungen oft nicht einmal auf der Wortebene eine sichere Wahl Viele komplexe Grammatik Phanomene sind von der MU noch gar nicht oder nur in Ansatzen erforscht Dann sind free rides oft die einzige Losung Solche Phanomene sind Auswahl Artikel Die germanischen und romanischen Sprachen haben Artikel viele andere Sprachen dagegen nicht Bei Ubersetzung aus einer anderen Sprache muss der jeweils richtige Artikel quasi aus dem Nichts generiert werden aber eben nicht in allen Fallen Zusammengesetzte Nomina In Sprachen wie Deutsch oder Japanisch kann die genaue Beziehung zwischen Nomina untereinander kaschiert werden indem man sie einfach nebeneinander stellt In anderen Sprachen muss die Beziehung explizit gemacht werden Beispiel Donaudampfschifffahrtsgesellschaftskapitan Ein Kapitan der bei einer Gesellschaft arbeitet die Dampfschiffe auf der Donau betreibt Zusammengesetzte Satzbestandteile In der walisischen Sprache kann eine sehr lange Nominalphrase in einem Wort stehen z B Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch Marienkirche in einer Mulde weisser Haseln in der Nahe eines schnellen Wirbels und in der Gegend der Thysiliokirche die bei einer roten Hohle liegt Relativpronomen Die meisten Sprachen haben gar kein oder nur ein einziges Relativpronomen Bei Ubersetzung ins Deutsche der die das oder Englische muss aber ausdifferenziert werden Tempus Modalitat Jede Sprache hat ihr eigenes System um zu sagen dass ein Satz in der Vergangenheit passiert oder ein Befehl ist In europaischen Sprachen wird dies oft mit Verb und Adverb realisiert Beispiele BearbeitenBeispiele fur maschinelle Ubersetzung sind Bing Translator 18 DeepL Google Ubersetzer SYSTRAN 19 Yandex TranslateSiehe auch BearbeitenAsia Pacific Association for Machine TranslationLiteratur BearbeitenDouglas Arnold et al Machine Translation An Introductory Guide Blackwell Manchester u a 1994 ISBN 1 85554 246 3 Kurt Eberle Integration von regel und statistikbasierten Methoden in der Maschinellen Ubersetzung In Uta Seewald Heeg Daniel Stein Hrsg Maschinelle Ubersetzung von der Theorie zur Anwendung JLCL Heft 3 09 2009 John W Hutchins Machine Translation Past Present Future Harwood und Wiley Chichester New York 1986 ISBN 0 470 20313 7 Uwe Muegge Lokalisierung und Maschinelle Ubersetzungssysteme In Jorg Hennig Marita Tjarks Sobhani Hrsg Lokalisierung von technischer Dokumentation Schmidt Romhild Lubeck 2002 ISBN 3 7950 0789 5 S 110 121 Jorg Porsiel Hrsg Maschinelle Ubersetzung Grundlagen fur den professionellen Einsatz BDU Weiterbildungs und Fachverlagsgesellschaft mbH Berlin 2017 ISBN 978 3 93843 093 4 Jorg Porsiel Hrsg Maschinelle Ubersetzung fur Ubersetzungsprofis BDU Weiterbildungs und Fachverlagsgesellschaft mbH Berlin 2020 ISBN 978 3 946702 09 2 Weblinks Bearbeiten nbsp Commons Maschinelle Ubersetzung Sammlung von Bildern Videos und Audiodateien nbsp Wiktionary maschinelle Ubersetzung Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen Texte von John Hutchins zur Geschichte der Maschinellen Ubersetzung unter anderem das Standardwerk Machine translation past present future Die Babel Maschine in Brussel Artikel bei heise deEinzelnachweise Bearbeiten John R Pierce John B Carroll et al Language and Machines Computers in Translation and Linguistics ALPAC report National Academy of Sciences National Research Council Washington DC 1966 H D Maas Das Saarbrucker Ubersetzungssystem SUSY In Sprache und Datenverarbeitung 1978 1 Axel Biewer et al A modular multilevel system for French German translation In Computational Linguistics Special issue on machine translation Volume 11 Issue 2 3 April September 1985 S 137 154 Verbmobil Info Phase 2 In verbmobil dfki de Abgerufen am 16 Juli 2016 statistical machine translation live Och Franz Google Research Blog Abgerufen am 21 Juli 2013 Dieser KI Forscher weiss dass smarte Roboter uns bald nachahmen werden podcast Minute 13 10 Abgerufen am 16 Marz 2018 KI ubersetzt so gut wie ein Mensch golem de vom 16 Marz 2018 Historischer Durchbruch KI ubersetzt Chinesisch so gut wie ein Mensch vrodo de vom 15 Marz 2018 Broad Operational Language Translation BOLT In www darpa mil Abgerufen am 16 Juli 2016 BOLT Linguistic Data Consortium In www ldc upenn edu Abgerufen am 16 Juli 2016 Philipp Koehn Statistical Machine Translation Hrsg Cambridge University Press ISBN 978 0 521 87415 1 Dzmitry Bahdanau et al Neural Machine Translation by Jointly Learning to Align and Translate In Proceedings of the International Conference on Learning Representations ICLR San Diego CA 2015 DeepL DeepL GmbH Koln abgerufen am 18 September 2017 Anna Grohn Online Ubersetzer im Vergleich Ich will den Hals langsam atmen In Spiegel Online 17 September 2017 spiegel de abgerufen am 18 September 2017 Kishore Papineni et al BLEU a method for automatic evaluation of machine translation In ACL 2002 40th Annual meeting of the Association for Computational Linguistics 2002 S 311 318 Callison Burch C Osborne M and Koehn P 2006 Re evaluating the Role of BLEU in Machine Translation Research in 11th Conference of the European Chapter of the Association for Computational Linguistics EACL 2006 pp 249 256 Chris Callison Burch et al Findings of the 2012 Workshop on Statistical Machine Translation In Proceedings of the Seventh Workshop on Statistical Machine Translation 2012 S 22 23 Bing Translator von Microsoft gesichtet 8 Januar 2018 Diese Ubersetzungssoftware gewann 2005 den Europaischen ICT Preis Normdaten Sachbegriff GND 4003966 3 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Maschinelle Ubersetzung amp oldid 236997217