Ticker

6/recent/ticker-posts

Ad Code

Responsive Advertisement

Aufschrei unter Künstler*innen: Sind Bild-Generatoren böse?

Ein Text-Befehl genügt, schon erschaffen KI-Systeme wie Stable Diffusion beeindruckende Kunstwerke. Trainiert wurden sie mit Abermillionen Bildern aus dem Netz. Sie stammen teils von Kreativen, die jetzt um ihre Jobs bangen. Ist das fair? Das sagen Fachleute.

Links eine Roboter-ähnliche Maschine im Steampunk-Stil. Sie hat Arme, Beine und Farb-Patronen. Der Hintergrund ist voller knalliger Farben. Rechts eine Person, die ich als Künstlerin interpretieren würde, sie trägt ein weißes Kleid und einen Hut.
Das Kunstwerk im Zeitalter seiner maschinellen Produzierbarkeit (Symbolbild), erstellt mit StableDiffusion („a machine spits out colorful paints, steampunk“); zusätzlicher Frame von DALL-E-2

Zuerst kam der Hype, dann kam der Ärger. Der Hype dreht sich um Anwendungen, die aus Worten Bilder machen. Sie haben futuristische Namen wie Stable Diffusion, DALL-E-2 und Midjourney. Innerhalb weniger Sekunden erschaffen sie Kunstwerke, Illustrationen, Zeichnungen und mehr. Begeisterte Nutzer*innen testen die frei verfügbaren Generatoren und fluten das Netz mit Millionen von Bildern. Beobachter*innen sehen darin eine Revolution, die alles verändert.

Weniger begeistert sind Menschen, die mit ihrem künstlerischen Handwerk weiter Geld verdienen wollen. Sie befürchten, dass ihnen die KI den Job wegnimmt. In einem polemischen Video-Essay macht der Designer und Illustrator Steven Zapata seinem Ärger Luft. Er spricht von „Diebstahl“ und „Ausbeutung“ durch die Organisationen hinter den Bild-Generatoren, denn sie haben ihre KI-Systeme mit Werken von Menschen trainiert. Einige davon verdienen noch immer mit ihrer Arbeit Geld und wurden nicht um ihr Einverständnis gefragt. „Wir sollten darüber wütend sein“, sagt Zapata.

Bild-Generatoren wie Stable Diffusion können nicht nur Jobs und Einkommen gefährden. Sie werfen auch ein neues Licht auf grundlegende Fragen: einerseits inwiefern die traditionelle Arbeit von Kreativen einen Schutz verdient – andererseits in welchem Ausmaß die Kunst uns allen gehören sollte.

„Stile gehören der Allgemeinheit“

Die neuen Bild-Generatoren arbeiten mit Text-Befehlen, sogenannten Prompts, zum Beispiel: „ein Waschsalon im Stil von Edward Hopper“. Auf diese Weise können sie neue Werke im Stil bekannter künstlerischer Strömungen erschaffen oder gar die Stile einzelner Künstler*innen nachahmen und miteinander verschmelzen. Gelernt hat das die KI, weil sie Abermillionen Werke auf Muster und Zusammenhänge untersucht hat.

Kreative feilen oft jahrelang an ihrem unverkennbaren Stil. Und jetzt kommt eine neue Software und beherrscht das Handwerk, als wäre es eine profane Rechenaufgabe. Wie ist das mit dem Ideal vereinbar, dass geistiges Eigentum einen Schutz verdient? Eine klare Antwort darauf hat der Rechtsanwalt und Rechtswissenschaftler Till Kreutzer. Er beschreibt die Neuordnung des Urheberrechts in der digitalen Welt als seine Passion. „Ich sehe ethisch überhaupt kein Problem darin, KI-Systeme mit Werken aus dem Internet zu trainieren, um neue Werke zu schaffen“, sagt er. „Künstlerisches Schaffen funktioniert schon immer so, dass aus Eindrücken und Inspirationen etwas Neues geschaffen wird.“

Jedes Werk sei ein Remix, sagt Kreutzer. Das bedeutet, dass sich jedes Werk schon immer an anderen orientiert, sei es durch direkte Zitate und Hommagen oder schlicht durch Inspiration. Kreutzer sagt: „Neu ist nur, dass diese Inspiration jetzt maschinell vorgenommen wird, und dass Maschinen diese Eindrücke anders verarbeiten.“

Diese Haltung spiegelt sich auch in der Gesetzgebung wieder. Der Schutz des geistigen Eigentums habe sich nie auf Stile erstreckt, wie Kreutzer erklärt. „Ein Stil darf nicht geschützt sein, weil das in die Kunstfreiheit eingreifen würde. Stile gehören wie Ideen und Konzepte der Allgemeinheit.“ Ansonsten, so Kreutzer, hätte sich der erste Expressionist ein Monopolrecht auf expressionistische Werke sichern können. Nein, die Grundidee beim Schutz des geistigen Eigentums sei eine andere. Hier gehe es nicht um Stile, sondern um Werke: „Große Unternehmen oder Plagiatoren sollten nicht einfach hingehen können und sich diese Leistungen unter den Nagel reißen.“

Der Anfang von etwas Großem

Ein Problem mit dem Urheberrecht entsteht erst dann, wenn ein KI-System die Bilder aus dem Trainingsmaterial stumpf kopiert. Dass so etwas zumindest möglich ist, legt ein Paper von US-Forschenden der Universitäten New York und Maryland nahe. Demnach konnten sie mit Stable Diffusion Bilder schaffen, die den Originalen aus dem Trainingsmaterial sehr ähnlich sahen. Genau das ist bei Bild-Generatoren allerdings nicht gewünscht, wie auch Till Kreutzer betont. „Es sollen eigenständige Darstellungen und Kompositionen sein.“ Das sei Sinn und Zweck der Technologie. „Wenn das nicht immer klappt, ist die Technologie nicht so gut, wie sie sein sollte.“

Den Aufschrei mancher Künstler*innen kann Kreutzer trotzdem nachvollziehen. „Ich finde es psychologisch verständlich, wenn Künstlerinnen und Künstler nicht möchten, dass die Technologie sie überholt und sie weniger Aufträge bekommen.“ Aber jede große Innovation bedeute Disruption für bestehende Technologien und Berufe.

Disruption nennt man es, wenn eine neue Erfindung den Markt umkrempelt. Damit verknüpfte Berufe brechen weg. Gewohnte Produkte und Dienstleistungen werden durch neue abgelöst. „Wenn so etwas verboten wäre, dann hätte es auch das Automobil nicht geben dürfen, um Kutscher und die Pferdezucht zu schützen“, sagt Kreutzer.

Auch Maschinen dürfen Kunstwerke studieren

Die Fähigkeiten von Bild-Generatoren mögen sich wie Science Fiction anfühlen. Im deutschen Recht gibt es aber bereits Gesetze, die darauf Antworten parat halten. Paragraf 44b im Urheberrechtsgesetz erlaubt „Data Mining“, also „die automatisierte Analyse“ von digitalen oder digitalisierten Werken, um darin Muster zu erkennen. Mit unter anderem dieser Regulierung hat Deutschland 2021 die europäische Urheberrechtsreform in nationale Gesetze gegossen. Till Kreutzer hält es für „sehr wahrscheinlich“, dass genau dieser Paragraf das Training von Bild-Generatoren rechtlich absichert.

So deutet auch Anke Schierholz die Rechtslage. Als Justiziarin für die Verwertungsgesellschaft Bild-Kunst (VG Bild-Kunst) setzt sie sich für die Rechte von Urheber*innen ein. Sie vertritt also eine Interessengruppe, die mit ihren Werken weiter Geld verdienen möchte, und die sich durch Bild-Generatoren bedroht sieht. Auch Schierholz schätzt: „KI-Systeme können dazu führen, dass Kreative weniger Aufträge bekommen.“

Zumindest eine juristische Möglichkeit haben Kreative, wenn sie ihre Werke nicht im Trainingsmaterial einer KI sehen möchten. Laut Paragraf 44b dürfen sie dem in „maschinenlesbarer Form“ widersprechen. Das heißt, Software muss den Widerspruch einfach erkennen können, wenn sie das Netz nach Trainingsmaterial für KI-Systeme durchforstet. Eine mögliche Einschränkung könnte aber ein weiterer Paragraf im Urheberrecht (60d) bringen: Er erlaubt unter bestimmten Bedingungen Data Mining „für Zwecke der wissenschaftlichen Forschung“. Der Datensatz hinter Stable Diffusion stammt etwa aus einem nicht-kommerziellen Forschungsprojekt.

Ein Künstler*innen-Paar aus Berlin möchte das Problem nicht auf dem Rechtsweg klären, sondern pragmatisch: Die Musikerin Holly Herndon und ihr Partner Mat Dryhurst haben die Initiative Spawning ins Leben gerufen und betreiben die Website haveibeentrained.com. Dort können Kreative Bescheid geben, wenn sie ihre Werke nicht zum Training von KI-Systemen bereitstellen möchten. Nach Angaben von Spawning hat sich Stable Diffusion schon bereit erklärt, diese Wünsche zu berücksichtigen.

KI-Kunst für alle

Aus einem Zeichenblock erhebt isch ein Roboter, der mit einem Bleistift auf diesen Zeichenblcok zeichnet.
Ein sich selbst zeichnender Roboter, generiert mit Stable Diffusion („a robot drawing himself drawing himself drawing himself in a loop, realistic, realism“)

Anke Schierholz hätte sich mehr gewünscht als ein bloßes Opt-out-Recht. „Eine Idee wäre, dass Kreative zumindest eine Vergütung erhalten, wenn ihre Werke zum Training einer KI genutzt werden“, sagt sie im Gespräch mit netzpolitik.org. „Es ist völlig klar, dass dabei pro Werk nur Mikro-Cent-Beträge herumkommen, aber immerhin.“

Eine ähnliche Forderung hatte auch der Bundesverband professioneller Bildanbieter (BVPA). Auch dieser Verband vertritt die kommerziellen Interessen einer Berufsgruppe; in diesem Fall sind das Pressebild-Agenturen und Bildarchive. Bereits im Jahr 2020 hatte der Verband in einer Stellungnahme beschrieben, wie Bild-Generatoren mithilfe von KI neue Werke schaffen können. Der Verband forderte, dass Werke nicht ohne Lizenz als Trainingsmaterial genutzt werden sollten.

Umgesetzt hat der Gesetzgeber das nicht. Unterm Strich wären solche Vergütungen wohl auch eher symbolischer Natur gewesen. Die möglichen Umwälzungen in der Branche können sie nicht aufhalten. Selbst die Opt-out-Wünsche einzelner Künstler*innen dürften am technologischen Fortschritt wenig ändern. Das Trainingsmaterial aus Hunderten Millionen Aufnahmen dürfte dadurch nur geringfügig schrumpfen.

„Es bleibt zu hoffen, dass es – ähnlich wie bei der Fotografie – eine Trennung gibt zwischen Qualität und Massenware“, sagt Schierholz. In anderen Worten: Auch wenn die meisten inzwischen eine Smartphone-Kamera in der Tasche haben, gibt es nach wie vor Profi-Fotograf*innen. „Das große Problem ist, dass kaum noch jemand bereit ist, für Qualität zu zahlen“, sagt Schierholz.

Eine Sache sei ihr besonders wichtig: „KI-generierte Ergebnisse dürfen keinen urheberrechtlichen Schutz genießen.“ Es dürfe nicht sein, dass Kreative zuerst aus dem Markt gedrängt würden, und man dann kassiere.

Von kostenloser Kunst und großem Geld

Freie KI-Kunst ohne Einschränkungen durch Lizenzen – an dieser Stelle überschneiden sich wohl die Ansichten von zwei Fraktionen, die sich selten einig sind: einerseits die Fraktion, die auf restriktives Urheberrecht pocht; andererseits die Fraktion, die freie Lizenzen, Meme-Kultur und das Recht auf Remix hochhält.

Aktuell sind Bild-Generatoren frei im Netz verfügbar. Auch die damit erschaffenen Werke dürfen frei genutzt werden. Stable Diffusion ist quelloffen. Das heißt, alle können es herunterladen, auf dem eigenen Rechner laufen lassen oder in Anwendungen einbauen. Wer nicht genug Rechenpower hat, um Stable Diffusion lokal zu nutzen, kann auf Browser-Anwendungen zurückgreifen. DALL-E-2 erlaubt jeden Monat ein paar kostenlose Anfragen, ab dann sollen Nutzer*innen zahlen. Es kostet auch etwas, wenn man den Generator in eigene Apps einbaut. Schon bald könnte DALL-E-2 allerdings in noch größerem Umfang verfügbar sein: Microsoft möchte die eigene Suchmaschine Bing damit aufrüsten.

All das legt nahe, dass Bild-Generatoren Kunst und künstlerisches Schaffen in die Mitte der Gesellschaft tragen, als Allgemeingut. Auch ohne besondere Fähigkeiten können alle Menschen kostenlos Bilder auf hohem handwerklichem Niveau erschaffen. Sie können sich davon unterhalten, inspirieren und beeindrucken lassen, ihre Wände oder Social-Media-Accounts damit verschönern und die Werke frei verbreiten. Doch das ist nur ein Teil der aktuellen Umwälzungen. Im Hintergrund geht es längst um viel Geld. Hinter dem Fortschritt rund um generative KI stecken große Summen und die Aussicht auf einen einflussreichen Markt.

Kampf um Vormacht im neuen Markt

Medienberichten zufolge erwägt derzeit Microsoft, 10 Milliarden US-Dollar in OpenAI zu investieren, dem Anbieter hinter dem Bild-Generator DALL-E-2. Auch das Start-up hinter Stable Diffusion, Stability AI, sammelt fleißig Geld von Investor*innen. Dabei sind Bild-Generatoren nur eine von mehreren Anwendungen generativer KI. Mit Chat-GPT hat Open AI Ende 2022 einen mächtigen Text-Generator veröffentlicht. Auf Anfrage erschafft Chat-GPT Aufsätze, Songtexte, Kochrezepte, Programmcode, Tutorials und vieles mehr. In Arbeit sind außerdem Anwendungen, die Videos und menschliche Stimmen generieren.

Mit DanceDiffusion entsteht derzeit eine Anwendung, die neue Musik erschaffen soll. Beim Training der KI verhält sich der Entwickler Stability AI allerdings anders als zuvor bei Stable Diffusion. So soll DanceDiffusion ausschließlich Musik von Freiwilligen und Stücke mit freien Lizenzen nutzen – aus „Respekt gegenüber dem geistigen Eigentum“, heißt es. Urheberrechts-Experte Kreutzer sieht darin jedoch kein Eingeständnis eines Fehlers. „Dass die Akteure beim Training der KI-Systeme mit Musik vorsichtiger sind als beim Training mit Bildern, ist erst einmal eine strategische Entscheidung im Umgang mit der Musik-Industrie“, sagt Kreutzer. Die Rechtsfrage sei die gleiche.

Es zeichnet sich noch nicht ab, in welcher Form die neuen Technologien bald zum digitalen Alltag werden. Generative KI könnte zum Beispiel grundlegend verändern, wie wir mit Suchmaschinen umgehen. Etwa, indem eine Suchmaschine unsere Anfragen nicht mehr mit Links zu passenden Bildern und Texten beantwortet, sondern den gewünschten Inhalt schlicht neu generiert. Doch das ist nur ein mögliches Szenario. Und wie bei vielen technologischen Neuerungen werden die Akteur*innen wohl zuerst versuchen, sich eine Vormacht-Stellung im Markt zu erkämpfen – egal, wie sich damit später nachhaltig Geld verdienen lässt.


Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

Enregistrer un commentaire

0 Commentaires