Überlegungen zur KI-Kunst

Bilder von Programmen: Kunst oder nicht?

·

    Künstliche Intelligenz gewinnt stetig an Präsenz im Alltagsleben. In den letzten paar Jahren sind sogar Programme entwickelt worden, die ganze Bilder nur anhand weniger Worte generieren können. Will ich ein Bild eines Baumes im Park bekommen, gebe ich lediglich Baum im Park ein und die KI kreiert das Bild für mich. Im Internet gibt es derzeit einen Trend, der darin besteht, diese Programme zu nutzen, um Bilder zu generieren, auf denen wohlbekannte Ereignisse, Figuren und Persönlichkeiten an Orten situiert sind, an denen diese fehl am Platz sind. Beispiele dafür wären Hochzeitszeremonie auf einer Mülldeponie, Trailcamaufnahmen von Joe Biden oder Kleinkinder auf Streik vor ihrem Kindergarten. Ich hatte gemeint, KI sei nur dazu fähig, Leute mit einem Geschmack für absurden Humor zu belustigen. Jedoch stolperte ich vor ein paar Monaten in den Weiten und Breiten der Social Media auf ein Stück digitaler Kunst, das mir ästhetisch gefallen hat. Es handelte sich um ein blaues Farbmuster, das einer Arabeske ähnelte, jedoch einen ausgeprägten futuristischen Look hatte. Mir gefiel diese Koppelung von Mittelalterlichem und Futuristischem, von Neuem und Altem. Als ich nachschauen wollte, wer die Künstler*in ist, war ich überrascht zu erfahren, dass das Bild mit Hilfe einer KI generiert wurde.1 Nicht wahrhaben wollend dass so ein schönes Stück mit einem automatisierten Prozess und ohne die volle gestalterische Beteiligung eines Menschen entstand, erkundigte ich mich nach weiteren solchen Kunstwerken. Nachdem ich die virtuelle Galerie des Internets gründlich erkundet und mich über den genauen Entstehungsprozess solcher Bilder informiert hatte, sah ich, dass KI durchaus ästhetisch wertvolle Stücke schaffen kann und dass die Produktion dieser Bilder ein komplexer Prozess ist. Ich musste mir eingestehen, dass KI ein hilfreiches Werkzeug zur Kunstgestaltung sein kann.

     

    In meinem früheren Widerwillen KI-Kunst zu akzeptieren war ich nicht allein. Neulich gewann ein Mann einen Kunstwettbewerb in Colorado. Dies geschah nicht ohne Kontroverse, denn das Bild, das ihm den ersten Platz bescherte, wurde ebenfalls mit Hilfe einer KI kreiert2. Es heisst, KI-Kunst sei keine echte Kunst und es sei zu leicht, mit Hilfe von KI-Kunst zu machen. Stimmen diese Einschätzungen? Ausser Kritiker*innen führt diese neue Technologie auch Künstler*innen dazu, sich um Ihr Handwerk Sorgen zu machen. Manche meinen, KI-Kunst könne in Zukunft traditionelle Kunst gänzlich ersetzen. Ist diese Besorgnis gerechtfertigt? Wie wird sich das Entstehen und die Weitereinwicklung dieser Technologie auf die Kunstwelt nun wirklich auswirken? Welche Vor-und Nachteile hat KI-Kunst im Vergleich zur herkömmlichen Kunst? Im Weiteren bin ich darum bemüht, diese Fragen zu beantworten. Vorweg: Bilder, die aus kommerziellen Gründen und zum Zweck der Massenproduktion gemacht werden wie Werbeplakate oder User Interfaces, mögen in Zukunft ausschliesslich mit KI gemacht werden, denn ihre Anfertigung ist deutlich günstiger als die der herkömmlichen Kunst. Das steht hier aber nicht zur Frage. Wie steht es um die l‘art pour l‘art? Wird es KI auch hier schaffen, die traditionelle Kunst zu verdrängen? Was ändert sich für die Kunstwelt?

     

    Aus der rezeptiven Perspektive betrachtet mag sich wohl gar nichts ändern. Die Urheber*in des Werks wird von diesem abstrahiert und es wird anhand seiner eigenen Qualitäten gedeutet. Barthes bezeichnet diesen Ansatz als den Tod des Autors.3 Auch vor jeglicher Interpretation, vor jeglichem Bemühen, Bedeutung und Erkenntnis aus dem Werk zu gewinnen, beim sinnlichen, visuellen Einwirken des Bildes auf uns, wenn wir dessen Farben, Formen und Komposition geniessen, gibt es auch da keinen Raum für die Urheber*in des Bildes. Die Funktion von Kunst ist es, das Allgemeine im Besonderen darzustellen.4 KI-Kunst ist dessen genauso fähig wie herkömmliche Kunst. Diese Darstellung ist nämlich nicht etwas Objektives, was von der Urheber*in in die Welt gesetzt wird, sondern etwas, was erst bei der Betrachtung und Deutung eines Bildes entsteht. Die Deutungen der Macher*innen sind dabei genauso viel Wert, wie die der Rezipient*innen. Wenn man also ein Bild vor sich hat und es geniesst, es deutet, von ihm gerührt ist, welche Rolle spielt es dann, womit und wie es erzeugt wurde? Der Juror des genannten Wettbewerbs wusste tatsächlich nicht, dass es sich bei dem Bild, das er als bestes einstufte, um ein KI-generiertes handelte. Rezeptiv betrachtet ist KI genauso künstlerisch legitim, wie herkömmliche Kunst.

     

    Wie steht es aber aus Sicht der Produktionsästhetik? KI macht zwar das Bild, aber am Anfang jedes Bildes steht eine menschliche Person. Die Künstler*in braucht am Anfang der Produktion lediglich das gewünschte Bild wörtlich zu beschreiben, nicht wahr? Diese Wortmalerei einer ganz anderen Art ist das Verlockende an diesen Programmen. Es heisst, KI-Programme wie Midjourney seien mit Natursprache allein bedienbar.5 Unter Natursprache wird die Sprache verstanden, die im Alltagsleben bei der Kommunikation untereinander benutzt wird. Diese Bezeichnung soll die Natursprache von Kunstsprachen unterscheiden. Diese sind Sprachen, die für einen gewissen Zweck entwickelt wurden, wie z.B. Programmiersprachen für das Entwickeln von Computerprogrammen. Die genannte Behauptung soll dann bedeuten, die KI könne in der gleichen Weise betätigt werden, in der wir im Alltag kommunizieren. Wenn wir Sprachen der Wittgensteinschen Auffassung nach verstehen, sind sie eine Art Spiel mit impliziten Regeln, die im Laufe des Spracherwerbs gelernt werden. Wenn mir Grüezi gesagt wird, antworte ich in der Regel mit Grüezi zurück. Wenn mir an der Kasse dreissig Franken Neunzig, bitte gesagt wird, nehme ich entsprechend viel Geld und bezahle. Wittgenstein nennt derartige Austausche Sprachspiele. Stimmt die Behauptung bezüglich dieser Programme also? Kann ich sie so benutzen, wie ich mich mit meinen Mitmenschen verständige?

    Tora greenster immanuel kant surfing on a wave at sunset in the b1a07f0e-7d86-4919-aea1-60e5711dd590

    Ich sage nein, denn so wie ich mit der KI rede, rede ich nicht mit anderen Menschen. Ich laufe nicht zu eine*r zufälligen Passant*in und sage: Immanuel Kant, wie er im roten Anzug auf einer Welle surft, im Stil eines Gemäldes aus dem 18. Jahrhundert, worauf die mir dann ein entsprechendes Bild malt. Es soll heissen, Kommunikation unter Menschen und die Benutzung einer KI zur Generierung von Bildern sind zwei unterschiedliche Sprachspiele mit unterschiedlichen Spielregeln und verschiedenen Funktionen. Genauer wäre es daher zu sagen, Midjourney sei mit einer Kunstprache zu gebrauchen, die sich an die Natursprache anlehnt und sich ihrer Worte bedient. Eine KI zu betätigen ist nämlich nicht so simpel, wie es klingt. Der Gewinner des Wettbewerbs sagt, er habe rund 900 Versionen des Bildes generiert, bis er auf eines stiess, das so genau wie möglich seiner Vorstellung entsprach. Dieser Prozess hatte rund 80 Stunden gedauert. Er musste auch an seinem Sprachgebrauch feilen, um dies zu erreichen. Wieso musste er das machen? Hier eine Aufgabe an die Leser*innen: Denken Sie an ein berühmtes Gemälde Ihrer Wahl. Stellen Sie sich nun alle Aspekte vor, die das Gemälde ausmachen: Komposition, Sujet, Farben, Belichtung, Stil, Medium usw. Versuchen Sie nun, das Bild so zu beschreiben, dass jeder einzelne dieser Aspekte akkurat beschrieben wird. Nicht so leicht, oder? Das liegt daran, dass die visuelle Anschauung viel feinkörniger ist als dies von unserer Sprache erfasst werden kann. Durch das Sieb der Sprache sickern viel mehr Details des sinnlich Gegebenen, als es bei der Anschauung der Fall ist. Es besteht grosser Zweifel, ob sich visuelle Daten überhaupt im Massstab 1:1 in die Natursprache umwandeln lassen. Die Natursprache ist nämlich nicht zu diesem Zweck entstanden, sondern um uns das gemeinsame Zusammenleben mit unseren Mitmenschen leichter zu machen. Interessanterweise lassen sich visuelle Daten aber viel leichter in eine Kunstsprache übersetzen. Ein Programm kann ein Rembrandt nämlich als eine Reihe von 1 und 0 darstellen, sodass sich diese Daten später in ein Pixelgrid umwandeln lassen können, welches das Gemälde klar und deutlich abbildet. Zudem reicht es nicht aus, lediglich in einem Satz die gewünschte Szenerie zu beschreiben. Es müssen diverse Epitete auf den Wunsch aufeinandergereit werden, wie 4k render, photorealistic, volumetric light, detailed etc. Oft muss die gewünschte Szene auch mit Synonymen umschrieben werden, um die Wahrscheinlichkeit zu erhöhen, dass eben der gewollte Effekt erzielt wird. Der grösste Nachteil von KI ist also auch ihre grösste Stärke – die Bedienung durch eine natursprachenähnliche Sprache. Hat jemand also eine bestimmte Vorstellung, welche diese Person mit Hilfe einer KI visuell zu gestalten versucht, muss sie die Bedienungssprache des Programms lernen, d. h. experimentieren, mit welchen Begriffen bestimmte Bilder zu generieren sind. Man redet davon, dass die KIs mit enorm grossen Datenbänken an Bildern und den mit ihnen assoziierten sprachlichen Beschreibungen trainiert werden müssen, um die graphischen Wünsche der Künstler*innen möglichst akkurat zu erfüllen. Tastächlich werden die kunstschaffenden Personen während dem Gebrauch der Programme auch selbst trainiert, nämlich darauf, die Spielregeln ihres gewählten Programms zu erlernen.

     

    Auch nach stundenlanger Übung müssen die Künstler*innen damit rechnen, dass sie nicht das exakte Resultat bekommen, das sie sich vorgestellt haben. Für sich genommen ist die Nutzung dieser Programme zur Anfertigung seriöser Kunst nicht unbedingt leichter oder einfacher, als die notwendigen Fähigkeiten zu erwerben, dank derer man das Kunststück auf traditionelle Weise schaffen kann. Es handelt sich um zwei unterschiedliche Arten Kunst zu schaffen, die beide ihre Vor- und Nachteile haben. Traditionelle Kunst hat dabei den klaren Vorteil, mehr Kontrolle über den Prozess der Kunstproduktion zu erlauben. Hier sei angemerkt, dass auch bei KI-Kunst ein Minimum an digitalen Malfähigkeiten erfordert ist, da die Bilder selten so wie gewünscht herauskommen und sie mit Photoshop verfeinert werden müssen. Gestalterische Fähigkeiten sind letzten Endes unumgänglich. Hegel hatte gemeint, die Malerei habe den Vorteil gegenüber allen anderen Kunstformen, die innigste Subjektivität anschaulich machen zu können4. Jeder Pinselstrich, jede Graphitlinie und jeder Farbklecks spielen dabei eine Rolle. Als jemand, der selbst Kunst schafft, schätze ich die Möglichkeit, über all das selbst bestimmen zu können. Meine Prognose für die Zukunft lautet daher, dass KI-Kunst und mit dem Körper gemachte Kunst Seite an Seite existieren werden, da die Modi ihrer Produktion unterschiedlich genug sind, um sich nicht gegenseitig in die Quere zu kommen.

     

     


     

    Literatur

    1Leider hatte ich in meinem Eifer vergessen zu notieren, wer die eigentliche Künstler*in hinter dem Bild war. Das Titelbild stellt meinen Versuch dar, das Bild zu rekonstruieren.

    2https://edition.cnn.com/2022/09/03/tech/ai-art-fair-winner-controversy/index.html

    3Barthes, Roland (1967): La mort de l'auteur. Im Essay bezieht sich dieser Ansatz spezifisch auf die Literatur, doch trifft auch auf visuelle Kunst zu.

    4 Gabriel, Gottfried (2019): Wahrheit und Fiktion. Frommann-Holzboog, Stuttgart. S. 96.

    5 https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/

    6 R. Pippin (2018): Painting. In: Sandkaulen, Brigit (Hrsg.) G.W.F. Hegel: Vorlesungen über die Ästhetik. Berlin, Boston. S. 190.