www.wikidata.de-de.nina.az
Stable Diffusion ist ein Deep Learning Text zu Bild Generator Die Open Source Software wird hauptsachlich zur Generierung detaillierter Bilder auf der Grundlage von Textbeschreibungen verwendet kann aber auch fur andere Aufgaben wie Inpainting Outpainting und die Erzeugung von Bild zu Bild Ubersetzungen auf der Grundlage einer schriftlichen Aufforderung Prompt eingesetzt werden Stable DiffusionEin von Stable Diffusion generiertes Bild mithilfe des Prompts a photograph of an astronaut riding a horse BasisdatenErscheinungsjahr 22 August 2022Aktuelle Version SDXL 1 0 1 26 Juli 2023 Programmiersprache PythonLizenz CreativeML Open RAIL Mstability ai stablediffusionStable Diffusion verwendet ein latentes Diffusionsmodell als Variante eines tiefen generativen neuronalen Netzes das von der CompVis Gruppe an der LMU Munchen 2 in Zusammenarbeit von Stability AI CompVis LMU und Runway mit Unterstutzung von EleutherAI und LAION entwickelt wurde 3 4 Im Oktober 2022 erhielt Stability AI in einer von Lightspeed Venture Partners und Coatue Management angefuhrten Finanzierungsrunde 101 Millionen US Dollar 5 Der Code und die Modellgewichte von Stable Diffusion wurden veroffentlicht 6 und konnen auf vielen Consumer Hardware Systemen ausgefuhrt werden sofern diese mit einer GPU mit mindestens 8 GB Grafikspeicher ausgestattet sind Die Verwendung auf weniger leistungsfahiger Hardware bzw ohne GPU Beschleunigung ist mittlerweile ebenfalls moglich jedoch deutlich langsamer Dieser offene Ansatz stellt eine Abkehr von fruheren proprietaren Text zu Bild Modellen wie DALL E und Midjourney dar die nur uber Cloud Dienste zuganglich waren 7 8 Inhaltsverzeichnis 1 Technologie 1 1 Trainingsdaten 2 Verwendung 3 Lizenz 4 Literatur 5 Weblinks 6 EinzelnachweiseTechnologie Bearbeiten nbsp Diagramm der von Stable Diffusion verwendeten ArchitekturTrainingsdaten Bearbeiten Stable Diffusion wurde anhand von Bild und Beschriftungspaaren aus LAION 5B trainiert einem offentlich zuganglichen Datensatz der aus Common Crawl Daten aus dem Internet abgeleitet wurde Dabei wurden 5 Milliarden Bild Text Paare auf der Grundlage ihrer Sprache Auflosung vorhergesagter Wahrscheinlichkeit ein Wasserzeichen zu enthalten und vorhergesagter asthetischer Bewertung z B subjektive visuelle Qualitat in separate Datensatze gefiltert 9 Der Datensatz wurde von LAION erstellt einer deutschen gemeinnutzigen Organisation die von Stability AI finanziert wird 9 10 Das Stable Diffusion Modell wurde auf drei Teilmengen von LAION 5B trainiert laion2B de laion high resolution und laion aesthetics v2 5 Eine von Dritten durchgefuhrte Analyse der Trainingsdaten des Modells ergab dass von einer kleineren Teilmenge von 12 Millionen Bildern aus dem ursprunglich verwendeten grosseren Datensatz etwa 47 der Bilder von 100 verschiedenen Domains stammten wobei Pinterest 8 5 der Teilmenge ausmachte gefolgt von Websites wie WordPress Blogger Flickr DeviantArt und Wikimedia Commons 9 11 Eine Recherche des Bayerischen Rundfunks zeigte dass die Datensatze von LAION die auf Hugging Face liegen grosse Mengen an privaten und sensiblen Daten enthalten 12 Verwendung BearbeitenStable Diffusion beansprucht keine Rechte an den generierten Bildern und raumt den Nutzern die Nutzungsrechte fur alle aus dem Modell generierten Bilder ein vorausgesetzt der Bildinhalt ist nicht illegal oder schadlich fur Personen Die den Nutzern gewahrte Freiheit bei der Verwendung der Bilder hat zu einer Kontroverse uber die Ethik des Eigentums gefuhrt da Stable Diffusion und andere generative Modelle anhand von urheberrechtlich geschutzten Bildern ohne die Zustimmung des Eigentumers trainiert werden 13 Da visuelle Stile und Kompositionen nicht dem Urheberrecht unterliegen wird haufig die Auffassung vertreten dass Benutzer von Stable Diffusion die Bilder von Kunstwerken generieren nicht gegen das Urheberrecht von visuell ahnlichen Werken verstossen Allerdings konnen Personen die in den generierten Bildern abgebildet sind durch Personlichkeitsrechte geschutzt sein wenn ihr Konterfei verwendet wird und geistiges Eigentum wie erkennbare Markenlogos bleiben weiterhin durch das Urheberrecht geschutzt Dennoch haben bildende Kunstler ihre Besorgnis daruber geaussert dass der weit verbreitete Einsatz von Bildsynthese Software wie Stable Diffusion dazu fuhren konnte dass menschliche Kunstler sowie Fotografen Models Kameraleute und Schauspieler allmahlich ihre kommerzielle Rentabilitat gegenuber KI basierten Konkurrenten verlieren 14 Im Vergleich zu anderen kommerziellen Produkten die auf generativer KI beruhen ist Stable Diffusion deutlich freizugiger was die Art der Inhalte angeht die die Nutzer erstellen durfen wie etwa gewalttatige oder sexuell eindeutige Bilder 15 Emad Mostaque CEO von Stability AI entgegnet den Bedenken dass das Modell zu missbrauchlichen Zwecken eingesetzt werden konnte Es liegt in der Verantwortung der Menschen ob sie diese Technologie auf ethische moralische und legale Weise einsetzen und dass die Technologie trotz moglicher negativer Folgen einen Nettonutzen bringen wurde wenn die Fahigkeiten von Stable Diffusion der Offentlichkeit zuganglich gemacht wurden 7 Daruber hinaus argumentiert Mostaque dass die Absicht hinter der offenen Verfugbarkeit von Stable Diffusion darin besteht die Kontrolle von Unternehmen uber solche Technologien zu beenden die bisher nur geschlossene KI Systeme fur die Bildsynthese entwickelt haben Dies spiegelt sich in der Tatsache wider dass alle Beschrankungen die Stability AI fur die von den Nutzern erzeugten Inhalte auferlegt aufgrund der Open Source Natur der Lizenz unter der Stable Diffusion veroffentlicht wurde leicht umgangen werden konnen 13 2023 nutzte ein japanisches Forscherteam Stable Diffusion um mittels funktioneller Magnetresonanztomographie fMRI bildhafte Erinnerungen von Probanden zu rekonstruieren und auszulesen 16 Lizenz BearbeitenIm Gegensatz zu Modellen wie DALL E stellt Stable Diffusion seinen Quellcode zusammen mit den vortrainierten Gewichten zur Verfugung 17 Die Lizenz von Stable Diffusion verbietet bestimmte Anwendungsfalle darunter Verbrechen Verleumdung Belastigung Doxing Ausbeutung von Minderjahrigen medizinische Ratschlage die automatische Schaffung rechtlicher Verpflichtungen die Erstellung juristischer Beweise und die Diskriminierung oder Schadigung von Einzelpersonen oder Gruppen aufgrund von sozialem Verhalten oder personlichen oder charakterlichen Eigenschaften oder gesetzlich geschutzten Merkmalen oder Kategorien Der Nutzer ist Eigentumer der Rechte an den von ihm erzeugten Bildern sofern fur KI generierte Kunst uberhaupt Urheberrecht beansprucht werden kann 18 und kann diese kommerziell nutzen 13 Literatur BearbeitenRobin Rombach Andreas Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer High Resolution Image Synthesis with Latent Diffusion Models 13 April 2022 doi 10 48550 arXiv 2112 10752 Weblinks Bearbeiten nbsp Commons Stable Diffusion Sammlung von Bildern Videos und Audiodateien Stable Diffusion Demo Easy Diffusion Stable Diffusion fur Windows 10 11 Linux Experimenteller Modus fur macOS soll bald kommen Der Rohstoff der KI sind wir Recherche des Bayerischen Rundfunks zu sensiblen und privaten Daten im LAION5b DatensatzEinzelnachweise Bearbeiten Announcing SDXL 1 0 englisch abgerufen am 3 August 2023 Der KI Bildgenerator Stable Diffusion stammt aus Munchen und soll KI demokratisieren 15 Dezember 2022 abgerufen am 20 Dezember 2022 Revolutionizing image generation by AI Turning text into images Abgerufen am 25 November 2022 englisch Emad Mostaque CEO of Stability AI Emad on Twitter Stable Diffusion came from the Machine Vision amp Learning research group CompVis LMU Muenchen Abgerufen am 29 Marz 2023 englisch Kyle Wiggers Stability AI the startup behind Stable Diffusion raises 101M In TechCrunch 17 Oktober 2022 abgerufen am 25 November 2022 amerikanisches Englisch Stable Diffusion CompVis Machine Vision and Learning LMU Munich 25 November 2022 abgerufen am 25 November 2022 a b James Vincent Anyone can use this AI art generator that s the risk 15 September 2022 abgerufen am 25 November 2022 amerikanisches Englisch The new killer app Creating AI art will absolutely crush your PC PCWorld 31 August 2022 archiviert vom Original am 31 August 2022 abgerufen am 25 November 2022 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www pcworld com a b c Andy Baio Exploring 12 Million of the 2 3 Billion Images Used to Train Stable Diffusion s Image Generator In Waxy org 30 August 2022 abgerufen am 25 November 2022 amerikanisches Englisch This artist is dominating AI generated art And he s not happy about it Abgerufen am 25 November 2022 englisch Alex Ivanovs Stable Diffusion Tutorials Resources and Tools Stack Diary In Stack Diary 8 September 2022 stackdiary com abgerufen am 25 November 2022 Katharina Brunner Elisa Harlan Der Rohstoff der KI sind wir Abgerufen am 12 September 2023 a b c Kenrick Cai Startup Behind AI Image Generator Stable Diffusion Is In Talks To Raise At A Valuation Up To 1 Billion Abgerufen am 25 November 2022 englisch This artist is dominating AI generated art And he s not happy about it Abgerufen am 25 November 2022 englisch 清水亮 Ryo Shimizu Midjourneyを超えた 無料の作画AI StableDiffusion が AIを民主化した と断言できる理由 26 August 2022 abgerufen am 25 November 2022 japanisch Wolfgang Stiegler Gedankenlesen Input fur Stable Diffusion direkt aus dem Gehirn In heise online 15 Marz 2023 abgerufen am 15 Marz 2023 Stable Diffusion Public Release Abgerufen am 25 November 2022 britisches Englisch KI Kunst Keine Urheberrechte fur Comics von Midjourney In Der Spiegel 23 Februar 2023 ISSN 2195 1349 spiegel de abgerufen am 22 Marz 2023 Abgerufen von https de wikipedia org w index php title Stable Diffusion amp oldid 238905554