KI-Bildgeneration: Wo stehen wir?

KI-Bildgeneration: Wo stehen wir?

Kaum öffnet man morgens das Smartphone, prasseln wieder die üblichen Schlagzeilen auf einen ein. "KI revolutioniert die Fotografie", "Fotografen vor dem Aus", "Künstliche Intelligenz macht Menschen überflüssig". Ach so. Wieder einmal also.

Lesezeit: 3 Min.

Da ich beruflich wenig Lust auf Arbeitslosigkeit habe, verfolge ich diese Entwicklungen naturgemäß mit gespitzten Ohren. Nachdem ich 2023 ausgiebig Photoshops "Generative Fill" durch alle erdenklichen Torturen gejagt hatte, war jetzt die brandneue Flux-Engine von Black Forest Labs dran. Juni 2025, neueste Generation, alle Register gezogen.

Für meinen Test nahm ich wieder dasselbe Foto von Dominika, wie sie entspannt auf dem Grün eines Golfplatzes liegt. Fairerweise sollte der Vergleich unter gleichen Bedingungen stattfinden, schließlich bin ich Fotograf und kein Wissenschaftler (obwohl sich die Grenzen manchmal verwischen).

Mein Original-Foto mit Dominika auf dem Golfplatz

Mein Prompt war bewusst simpel gehalten: "Füge ein Golf-Kart mit einem Pärchen, das weiß gekleidet ist, im Hintergrund hinzu. Verändere nicht das Modell auf meinem Original-Foto." Klarer geht's eigentlich nicht, oder? Ich dachte mir: Wenn die KI schon die Welt erobern will, dann soll sie wenigstens verstehen, was ich von ihr möchte.

Das erste, was mir auffiel: Dominika wurde "optimiert". Obwohl das definitiv nicht Teil meines Auftrags war. Die KI hatte offenbar ihre eigenen Vorstellungen davon, wie eine Frau auf einem Golfplatz auszusehen hat. Manchmal wurde ihr Fuß in anatomisch fragwürdige Richtungen verbogen, das Gesicht bis zur Unkenntlichkeit manipuliert oder zumindest das Licht so drastisch verändert, dass das Ergebnis mit meinem Original etwa so viel gemeinsam hatte wie ein Hundehaufen mit einem Schokokuchen.

Optimiert? Von mir aus gerne, wenn ich danach frage. Aber wenn keine Optimierung gewünscht ist, arbeitet die KI nicht nur kontraproduktiv, sondern geradezu gefährlich.

Die Golf-Karts selbst? Durchaus ansehnlich, muss ich zugeben. Die KI hat verstanden, was ein Golf-Kart ist und wie es ungefähr aussehen sollte. Bei den Menschen darauf wurde es allerdings wieder skurril. Ein männliches Pärchen hier, ein gemischtes dort, manchmal sogar ein Dreier auf einem Gefährt, das definitiv nicht für drei Personen konstruiert wurde. Mein Prompt hatte "Pärchen" gesagt, nicht "Akrobatik-Truppe". Aber gut, Kreativität kann man der KI nicht absprechen.

Sind die Ergebnisse photorealistisch? Auf den ersten Blick vielleicht. Auf den zweiten definitiv nicht. Könnte man damit auf Social Media Menschen täuschen? Ganz bestimmt. Ist das die Zukunft der Fotografie? Niemals.

Nach diesem Test bin ich überzeugt: Wir sind mit der KI-Bildgenerierung noch deutlich weiter entfernt von der Realität, als es die mediale Berichterstattung suggeriert. Natürlich nur, wenn man kritisch hinsieht.

Ich werde die Entwicklung weiter beobachten. Nicht aus Angst, sondern aus professioneller Neugier.

Moment mal, was ist mit Dominikas Fuß passiert?
Dies könnte das Gewinner-Bild sein, aber Dominikas Gesicht wurde zu extrem "optimiert".
Habe ich nach noch mehr "Optimierung" und Überschärfen gefragt? Was machen die siamesischen Zwillinge da im Hintergrund?
Ein Dreier im Hintergrund. Wenigstens ist sie unterhaltsam, die KI.
Oder vielleicht lieber eine Braut als Gepäckstück?
Definitiv nicht mehr Dominikas Gesicht. Und der Golfball (von dem nie die Rede war) ist zu groß.
Ich wollte gerade den Gewinner verkünden, als ich sah, dass das Pärchen nur zwei Beine hat… zusammen.
Dann ist das hier das beste Bild. Aber die Frau sitzt nicht und steht nicht. Ich bin nicht überzeugt.

Navigieren