www.wikidata.de-de.nina.az
Dragon NaturallySpeaking ist eine Spracherkennungs Software die das gesprochene Wort in Text auf dem Bildschirm oder Steuerungsbefehle fur den Computer umsetzt Dragon NaturallySpeaking ist in verschiedenen Ausgaben fur private und professionelle Nutzer zu kaufen unabhangige Anbieter liefern zusatzliche Fachvokabulare Seit der nur intern verwendeten Versionsnummer 14 wird die Bezeichnung NaturallySpeaking vom Hersteller nicht mehr verwendet Stattdessen erfolgt die Vermarktung unter dem Namen Dragon gefolgt von der Bezeichnung der Edition wie z B Dragon Professional Individual Die ahnliche fur das Betriebssystem macOS geschriebene Variante hiess zuletzt Dragon Professional Individual fur Mac wird aber seit Oktober 2018 nicht mehr vertrieben 1 Die Bezeichnung Dragon NaturallySpeaking wird hier zur besseren Abgrenzung zunachst beibehalten Nuance DragonBasisdatenEntwickler Nuance CommunicationsAktuelle Version 16 Professional Individual und Group Februar 2023 Betriebssystem WindowsKategorie SpracherkennungLizenz Proprietardeutschsprachig jahttps www nuance com dragon html Inhaltsverzeichnis 1 Anfange 2 Funktionsweise 3 Systemanforderungen und Features 4 Erkennungsgenauigkeit 5 Versionen 6 Weblinks 7 EinzelnachweiseAnfange BearbeitenDie Anfange des Programms und des ursprunglichen Herstellers beruhen auf einem Prototyp von Software zur Spracherkennung der Ende der 1970er Anfang der 1980er Jahre von James und Janet Baker entwickelt worden war wahrend sie zunachst an der Carnegie Mellon University spater an einem IBM Forschungszentrum tatig waren 2 Die Bakers grundeten Dragon Systems im Mai 1982 3 Vorlaufer von Dragon NaturallySpeaking war die Software DragonDictate die fur DOS geschrieben war und noch keine kontinuierliche Spracherkennung ermoglichte Dragon NaturallySpeaking 1 0 erschien 1997 Im Jahr 2000 wurde das Unternehmen von Lernout amp Hauspie ubernommen Aus dessen Insolvenzmasse erwarb 2005 das amerikanische Unternehmen ScanSoft die Rechte daran welches heute Nuance Communications heisst Funktionsweise BearbeitenDragon NaturallySpeaking ist eine Software zur Spracherkennung am PC Die Software setzt Ausserungen die in ein mit dem Computer verbundenes Mikrofon gesprochen werden in Text oder Steuerungsbefehle um Es handelt sich um ein sprecherabhangiges eine Anpassung an den Nutzer erforderndes Front End System also eines bei dem die Umsetzung der Sprache in Text auf dem Rechner des Nutzers erfolgt und unmittelbar nach dem Diktat der Ausserung sichtbar ist what you say is what you see Im Verhaltnis etwa zur Spracherkennungsfunktion von Smartphones bei der die Umsetzung der uber das Internet gesendeten akustischen Informationen auf zentralen Servern erfolgt und der Text dann zuruck ubertragen wird ergeben sich hierdurch moglicherweise Vorteile bei Geschwindigkeit und Genauigkeit der Umsetzung sowie der Moglichkeit zur Anpassung an Wortschatz und Bedurfnisse des Nutzers Je nach Version wird von DragonNaturally Speaking auch die Umsetzung zuvor mit einem Diktiergerat oder einem Aufnahmeprogramm aufgezeichneter Diktate unterstutzt Die akustischen Signale werden zur Umsetzung vereinfacht gesagt digital abgetastet und im Rahmen eines akustischen Modells nach Charakteristika eingeordnet die eine ungefahre Zuordnung zu Lauten ermoglichen Die Auswahl erfolgt statistisch unter Einsatz verschiedener Varianten von Hidden Markov Modellen Ab der Version 15 ruhmt sich Dragon eine neue Spracherkennungsengine unter Einsatz von Deep Learning zu verwenden 4 Dieses akustische Modell wird bei einem in aktuellen Versionen nicht mehr notigen anfanglichen Training und fortlaufend bei der Benutzung insbesondere durch die Korrektur von Erkennungsfehlern an die Stimme des jeweiligen Sprechers angepasst Zu den erkannten Lauten werden dann statistische Hypothesen uber die jeweils am wahrscheinlichsten gesagten Worte angestellt Bei ahnlich oder gleich klingenden Lauten Worten entscheidet die Software somit anhand von Mehrwortfolgen innerhalb der Ausserung des Sprechers welches Ergebnis als Text auf dem Bildschirm erscheint Grundlage hierfur ist ein Sprachmodell linguistisches Modell welches diese Wahrscheinlichkeiten beschreibt Einzelheiten sind im Artikel zur Spracherkennung naher erlautert Der Erkennungsvorgang lauft auf aktueller Hardware normalerweise so schnell im Hintergrund ab dass der gesprochene Text fast sofort nach Beendigung der Ausserung auf dem Bildschirm erscheint Im Auslieferungszustand enthalt die Software Standard Sprachmodelle fur die jeweilige Eingabesprache die auf einer Analyse der Wahrscheinlichkeit von Wortfolgen innerhalb eines sehr grossen Text Corpus durch den Hersteller beruhen Bei der Einrichtung der Software am PC des Nutzers der Anlage eines Benutzerprofils kann dieses Standard Sprachmodell durch die Analyse von vorhandenen Texten des jeweiligen Nutzers an dessen Schreibstil angepasst werden Dies erfolgt auch fortlaufend wahrend der Benutzung sogenannte Modelloptimierung Fur diese fortwahrende Verbesserung des linguistischen Modells aber auch fur die des akustischen Modells ist dabei insbesondere die konsequente Korrektur der falsch erkannten Worter und Wortkombinationen vermittels der entsprechenden Programmfunktionen wichtig Dragon NaturallySpeaking verwendet bei dem in der alteren Version 11 vorherrschenden Sprachmodell BestMatch IV Zusammenhange von bis zu vier Wortern sogenannte Quadgramme Ab der Version 12 richtete Dragon auf entsprechend leistungsstarken PCs Mehrkernprozessoren und Arbeitsspeicher von mehr als 2 GB RAM Benutzerprofile mit dem Sprachmodell BestMatch V ein welches Funfwortfolgen analysieren sollte Mit der Version 15 wurde das Sprachmodell wieder als BestMatch IV bezeichnet was im Zusammenhang mit der veranderten Erkennungstechnik stehen soll Das Sprachmodell funktioniert ausschliesslich nach statistischen Methoden nicht nach grammatikalischen Regeln Die Erkennungsgenauigkeit ist aufgrund dieser Funktionsweise am besten wenn zusammenhangende Ausserungen gesprochen werden am besten ganze langere Satze Dementsprechend ist die Software auf die Erkennung von gut strukturierter Sprache ausgerichtet wie fur Diktate von Briefen Berichten und sonstigen Sachtexten typisch nicht aber etwa fur die Umsetzung von aufgezeichneten mundlichen Alltagsausserungen mit vielen Satzbruchen Auslassungen und Fullseln erst recht nicht fur die direkte Umsetzung von Gesprachen mehrerer Sprecher in Text Das Sprachmodell von Dragon NaturallySpeaking baut auf einem mitgelieferten Vokabular Wort Lexikon auf welches im Auslieferungszustand ca 150 000 Wortformen im aktiven Vordergrundvokabular enthalt Da die Software keine grammatikalischen Regeln anwendet sind im Vokabular nicht nur die Wortstamme sondern alle einzelnen Wortformen hinterlegt Dieses Vokabular lasst sich nutzerspezifisch durch Analyse eigener Texte auf unbekannte Worter und Wortformen aber auch durch die Korrektur bei Erkennungsfehlern um ca weitere 150 000 Wortformen erganzen Um die Geschwindigkeit der Umsetzung in einem akzeptablen Bereich zu halten ist das Vokabular in verschiedene Slots gegliedert also ein Vordergrundvokabular und ein Hintergrundvokabular dessen Grosse auf ca 250 000 300 000 Eintrage geschatzt wird Zum aktiven Zugriff wird nur das Vordergrundvokabular im Arbeitsspeicher gehalten Worter aus dem Hintergrundvokabular werden hinzugefugt nachdem sie einmal verwendet und dabei fehlerhaft erkannt und dann korrigiert wurden Das Sprachmodell der Software ist auf eine bestimmte Sprache ausgerichtet das heisst es ist nicht moglich mit demselben Benutzerprofil Texte in verschiedenen Eingabesprachen zu diktieren Um in einer anderen Sprache zu diktieren muss vielmehr ein entsprechendes gesondertes Benutzerprofil angelegt sein und aufgerufen werden Die deutsche Version von Dragon NaturallySpeaking ermoglicht die Anlage von Benutzerprofilen in Deutsch und Englisch Die Software ist auch fur Spanisch Franzosisch Italienisch Niederlandisch und Japanisch erhaltlich allerdings nicht in Form einzelner Module sondern in Form separater Versionen 5 Gebrauchliche Fremdworter sind im mitgelieferten Vokabular enthalten die Hinzufugung und zuverlassige Erkennung weiterer Fremdworter deren Aussprache nicht der ublichen Lautung im Deutschen entspricht kann durch den Benutzer erfolgen indem solche Worter mit einer lautmalerischen gesprochenen Form im Lexikon hinterlegt werden Beispieleintrage geschriebene Form breakage gesprochene zum Beispiel brehkitsch oder geschriebene Form CIA gesprochene Ssie ei ai Der bis zur Version 13 verwendete Name der Software NaturallySpeaking leitet sich von der Eigenschaft einer kontinuierlichen Spracherkennung ab Anders als bei Spracherkennungssystemen die bis Mitte der Neunzigerjahre des 20 Jahrhunderts verwendet wurden und auch noch anders als beim Vorganger DragonDictate muss der Sprecher zwischen den einzelnen Wortern keine unnaturlichen Sprechpausen machen diskrete Sprache sondern kann kontinuierlich sprechen Die Software kann aus den Lautfolgen die wahrscheinlichen Wortgrenzen anhand der beschriebenen Methoden selbst ermitteln Gleichwohl ist eine strukturierte deutliche aber nicht ubertrieben artikulierte und flussige Sprechweise der beste Erfolgsgarant der Hersteller empfiehlt sich an der Sprechweise von Nachrichtensprechern zu orientieren Systemanforderungen und Features BearbeitenDragon NaturallySpeaking lauft unter dem Betriebssystem Windows ab Windows XP unter 64 bit Windows ab der Version 10 1 Fur macOS vertrieb Nuance bis September 2018 eine auf demselben Spracherkennungskern aufbauende Software die bis zur Version 4 auf den Namen Dragon Dictate horte aber nicht mit dem oben genannten Vorlaufer von Dragon NaturallySpeaking zu verwechseln ist und in der letzten verfugbaren Version 6 Dragon Professional Individual fur Mac genannt wurde Diese macOS Fassung bleibt in der Funktionalitat von Korrekturen und Steuerungsmoglichkeiten fur den Computer hinter den Windows Versionen von Dragon zuruck Vertrieb und Unterstutzung der macOS Version wurden von Nuance im Oktober 2018 eingestellt 1 Dragon NaturallySpeaking lauft nicht nativ auf Betriebssystemen mit Linux Kern z B Ubuntu Red Hat openSuSE etc 6 Das API Ubersetzungssystem Wine ermoglicht aber einen stabilen Einsatz der Kernkomponenten einiger Versionen vorausgesetzt eine manuell angepasste Installation wurde von einem erfahrenen Linux Nutzer durchgefuhrt die Moglichkeit zur Steuerung von nativen Programmen ist allerdings nicht gegeben ebenfalls in Wine laufende Programme wie das Wine Wordpad Clon oder das DragonPad sowie die automatische Verschriftlichung von MP3 Dateien funktionieren aber problemlos 7 Es ware auch denkbar die Windows Version von z B LibreOffice und Firefox unter Wine durchzufuhren um diese dann mit Dragon steuern zu konnen Ab der Version 11 setzt NaturallySpeaking auf Mehrkern Prozessoren eine Multipass Technik ein bei welcher die gleiche Ausserung parallel auf zwei Prozessorkernen analysiert und die wahrscheinlichste Ausserung unter Einsatz jeweils unterschiedlicher Hidden Markov Modelle ermittelt wird um auf diese Weise die Zuverlassigkeit zu erhohen Um genugend Rechner Kapazitat fur andere Aufgaben insbesondere die Ziel Anwendungen in die hinein diktiert wird zu behalten empfiehlt sich daher der Einsatz auf modernen Prozessoren Prozessor und Grosse des Arbeitsspeichers sowie ein ausreichend grosser 2nd bzw 3rd Level Cache haben auch erheblichen Einfluss auf die Geschwindigkeit der Umsetzung Bei einem leistungsfahigen aktuellen PC erscheint der Text zumeist unmittelbar nachdem eine Ausserung ausgesprochen ist Obwohl das Programm relativ hohe Anforderungen an die Grosse des Arbeitsspeichers und die Kapazitat des Prozessors stellt ist die Benutzeroberflache eine unauffallige Dragon Leiste die auch ganz ausgeblendet werden kann Das Konzept geht dahin dass der Benutzer direkt in Ziel Anwendungen wie Textverarbeitungsprogramme diktiert in denen dann der gesprochene Text ohne Tastatureingabe erscheint Ebenso konnen kompatible Anwendungsprogramme durch gesprochene Befehle gesteuert werden z B Speichern oder Drucken von Dokumenten Formatierungen diese Funktionen werden nicht zuletzt von Benutzern mit Bewegungseinschrankungen geschatzt Zur Kommunikation mit Anwendungsprogrammen greift Dragon NaturallySpeaking auf die MSAA Microsoft Active Accessibility Schnittstelle und die Microsoft Sprachanwendungsschnittstelle SAPI 4 nicht die Nachfolgeversion 5 zuruck Der volle Befehlssatz zur Steuerung von Anwendungen steht daher nur in entsprechend kompatiblen Anwendungsprogrammen wie Microsoft Word Version 2013 ist erst ab NaturallySpeaking 12 5 kompatibel Version 2016 ab Dragon Professional Individual bzw 14 oder Internet Explorer zur Verfugung in der Software als Standardfenster oder Fenster mit voller Textkontrolle bezeichnet in fruheren Versionen auch als Select and Say Andere Software wie OpenOffice Writer Mozilla Firefox oder Mozilla Thunderbird werden teilweise unterstutzt Browser basierte Cloud Anwendungen wie Outlook com werden nur teilweise unterstutzt nicht z B die Microsoft Office Web Apps Dragon NaturallySpeaking verfugt auch uber ein eigenes einfaches Textverarbeitungsprogramm DragonPad welches funktional Microsoft WordPad ahnelt sowie uber ein Diktierfenster welches zum Transfer von diktiertem Text in nicht kompatible Zielanwendungen benutzt werden kann Neben kompatiblen Anwendungsprogrammen kann man mit Dragon NaturallySpeaking die Windows Oberflache mit Sprachbefehlen steuern im Startbildschirm von Windows 8 nur eingeschrankt Erkennungsgenauigkeit BearbeitenDie Software setzt ein anfangliches etwa funfminutiges Sprechertraining voraus welches ab Version 9 aber auch ubersprungen werden kann sowie moglichst eine Analyse eigener Texte des Sprechers Die Erkennungsrate liegt bei einem gut eintrainierten Profil je nach Qualitat der Hardware und Deutlichkeit der Sprechweise derzeit bei mehr als 98 Prozent Auch durch die Verwendung eines besseren als des vom Hersteller mitgelieferten Mikrofons kann die Erkennungsgenauigkeit positiv beeinflusst werden Traditionell galt Je eher ein begrenztes Fachvokabular zum Einsatz kommt etwa bei Arzten oder Anwalten umso besser die Erkennungsrate Aufgrund der Steigerung der Leistungsfahigkeit des Programms und der Hardware besteht bei den aktuellen Versionen praktisch nicht mehr die Notwendigkeit fur bestimmte Fachgebiete jeweils eigene Vokabulare einzusetzen Jedoch gilt nach wie vor dass im Vokabular nicht bereits vorhandene Worter auch nicht richtig erkannt werden konnen Eine Ausnahme bildet in der deutschen Version die Funktion zur automatischen Bildung von Komposita Typische Bestandteile von zusammengesetzten Wortern sind im Vokabular zusatzlich mit Merkmalen versehen wonach sie mit anderen Wortern zu Komposita ggf mit Fugen s zusammengezogen werden wenn diese unmittelbar davor oder danach diktiert werden Auch diese Funktion ist statistisch gesteuert und liefert daher zuweilen auch falsche Komposita z B bei Zusammengesetztenwortern Solche Falle gehoren zu den wenigen in denen Erkennungsfehler von einer Rechtschreibprufung in der Zielanwendung bemerkt werden im Gegensatz zu falsch erkannten Wortern wie in dem fiktiven Beispiel Der Auszubildende ging in die Leere Ein Korrekturlesen von mittels Spracherkennung diktierten Texten ist daher empfehlenswert worauf der Hersteller in der Lizenzvereinbarung ausdrucklich hinweist Versionen BearbeitenLegende Alte Version Altere Version noch unterstutzt Aktuelle Version Aktuelle Vorabversion Zukunftige VersionVersion Veroffentlichung EditionenAltere Version nicht mehr unterstutzt 1 0 Juni 1997 PersonalAltere Version nicht mehr unterstutzt 2 0 November 1997 Standard Preferred DeluxeAltere Version nicht mehr unterstutzt 3 0 Oktober 1998 Point amp Speak Standard Preferred Professional optionale Legal oder Medical Add ons Altere Version nicht mehr unterstutzt 4 0 4 August 1999 Essentials Standard Preferred Professional Legal Medical MobileAltere Version nicht mehr unterstutzt 5 0 August 2000 Essentials Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 6 0 15 November 2001 Essentials Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 7 0 Marz 2003 Essentials Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 8 0 November 2004 Essentials Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 9 0 Juli 2006 Standard Preferred Professional Legal Medical SDK client SDK serverAltere Version nicht mehr unterstutzt 9 5 Januar 2007 Standard Preferred Professional Legal Medical SDK client SDK serverAltere Version nicht mehr unterstutzt 10 0 7 August 2008 Essentials Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 10 1 Marz 2009 Standard Preferred Professional Legal MedicalAltere Version nicht mehr unterstutzt 11 0 24 August 2010 Home Premium Professional LegalAltere Version nicht mehr unterstutzt 11 0 Marz 2011 MedicalAltere Version nicht mehr unterstutzt 11 5 Juni 2011 PremiumAltere Version nicht mehr unterstutzt 11 5 Juli 2011 Home Professional LegalAltere Version nicht mehr unterstutzt 12 0 August 2012 Home PremiumAltere Version nicht mehr unterstutzt 12 0 September 2012 Professional LegalAltere Version nicht mehr unterstutzt 12 0 Dezember 2012 Medical PracticeAltere Version nicht mehr unterstutzt 12 5 Februar 2013 Home Premium Professional LegalAltere Version nicht mehr unterstutzt 13 0 August 2014 Home PremiumAltere Version nicht mehr unterstutzt 13 0 Oktober 2014 Professional LegalAltere Version nicht mehr unterstutzt 14 0 September 2015 Professional Individual GroupAltere Version nicht mehr unterstutzt 14 0 April 2016 Professional Group Legal Group Legal IndividualAltere Version nicht mehr unterstutzt 15 0 Oktober 2016 Professional IndividualAltere Version nicht mehr unterstutzt 15 0 Mai 2017 Professional GroupAltere Version nicht mehr unterstutzt 15 1 November 2017 Professional Group Legal Group jeweils nur Volumenlizenzierung VLA Altere Version nicht mehr unterstutzt 15 3 Februar 2018 Professional Group Legal GroupAltere Version nicht mehr unterstutzt 15 4 April 2019 Professional Group Legal Group jeweils nur Volumenlizenzierung VLA Altere Version nicht mehr unterstutzt 15 5 November 2019 Professional Group Legal GroupAltere Version nicht mehr unterstutzt 15 6 Juli 2020 Professional Group Legal GroupAltere Version nicht mehr unterstutzt 15 61 Dezember 2020 Professional Group Legal GroupAltere Version nicht mehr unterstutzt 15 7 1 September 2021 Professional Group Legal GroupAktuelle Version 16 Marz 2023 Professional Legal2020 1 bis 4 Januar 2020 Professional Anywhere Legal Anywhere Medical One2021 1 bis 4 Januar 2021 Professional Anywhere Legal Anywhere Medical OneWeblinks BearbeitenDragon NaturallySpeaking auf der Webseite des Herstellers Anwenderforum fur Dragon NaturallySpeakingEinzelnachweise Bearbeiten a b Dragon Professional Individual for Mac End of Life Memento vom 7 November 2020 im Internet Archive Geschichte von Dragon Systems englisch aufgerufen am 2 Juli 2011 Speechless Portrat uber Janet McIver Baker Tufts University Magazine Herbst 2012 englisch aufgerufen am 6 Oktober 2012 Dragon Professional 16 ubertrifft alle Erwartungen und ist besser als je zuvor Verzeichnis der Sprachversionen auf der Herstellerseite englisch aufgerufen am 23 Februar 2013 Frequently Asked Questions Nuance archiviert vom Original am 6 August 2015 abgerufen am 11 August 2015 englisch WineHQ Dragon Naturally Speaking 12 5 Abgerufen am 3 Marz 2021 Abgerufen von https de wikipedia org w index php title Dragon NaturallySpeaking amp oldid 236987566