AI Image Generation: Where Do We Stand? 🇺🇸 🇩🇪

AI Image Generation: Where Do We Stand? 🇺🇸 🇩🇪

You barely open your phone in the morning before you're hit with the usual headlines. "AI revolutionizes photography," "Photographers on the brink," "Artificial intelligence makes humans obsolete." Oh, right. Here we go again.

 

Dieser Artikel auf Deutsch ›

Since I'm not particularly keen on unemployment, I naturally follow these developments with keen interest. After putting Photoshop's "Generative Fill" through every conceivable torture test in 2023, it was time for Black Forest Labs' brand-new Flux engine. June 2025, latest generation, all stops pulled out.

For my test, I used the same photo of Dominika lying relaxed on a golf course green. To be fair, the comparison should be done under equal conditions — after all, I'm a photographer, not a scientist (though the lines sometimes blur).

My original image with Dominika on the green

My prompt was deliberately simple: "Add a golf cart with a couple dressed in white in the background. Don't change the model in my original photo." Can't get much clearer than that, right? I figured if AI wants to conquer the world, it should at least understand what I'm asking of it.

The first thing I noticed: Dominika got "optimized." Even though that definitely wasn't part of my brief. The AI apparently had its own ideas about how a woman on a golf course should look. Sometimes her foot got twisted in anatomically questionable directions, her face manipulated beyond recognition, or at least the lighting changed so drastically that the result had about as much in common with my original as dog poop has with chocolate cake.

Optimized? Fine by me, if I ask for it. But when no optimization is requested, the AI doesn't just work counterproductively—it works dangerously.

The golf carts themselves? Actually quite decent, I have to admit. The AI understood what a golf cart is and roughly how it should look. But with the people on it, things got weird again. A male couple here, a mixed couple there, sometimes even a threesome on a vehicle definitely not designed for three people. My prompt said "couple," not "acrobatic troupe." But hey, you can't deny the AI's creativity.

Are the results photorealistic? At first glance, maybe. At second glance, definitely not. Could you fool people on social media with them? Absolutely. Is this the future of photography? Never.

After this test, I'm convinced we're still much further from reality with AI image generation than media coverage suggests. Of course, that's only if you look critically.

I'll keep watching these developments. Not out of fear, but out of professional curiosity.

Wait a minute, what's with Dominika's foot?
This could be the winner, but Dominika's face got "optimized" to an extreme
Did I ask for even more optimization and over-sharpening? And what's with the siamese twins in the background?
Now, we have a threesome going on in the background. That's entertraining to be fair (but not what I asked for).
Or would you prefer a woman in a wedding dress loaded on the back of the cart?
This is not Dominika's face anymore. And the golf ball (that was never asked for) is simply too large.
I wanted to call this the winner, until I saw that the couple has only two legs… together
So this is the winning image. But the woman is not sitting, not standing. I am not convinced.

 


KI-Bildgeneration: Wo stehen wir?

Kaum öffnet man morgens das Smartphone, prasseln wieder die üblichen Schlagzeilen auf einen ein. "KI revolutioniert die Fotografie", "Fotografen vor dem Aus", "Künstliche Intelligenz macht Menschen überflüssig". Ach so. Wieder einmal also.

Da ich beruflich wenig Lust auf Arbeitslosigkeit habe, verfolge ich diese Entwicklungen naturgemäß mit gespitzten Ohren. Nachdem ich 2023 ausgiebig Photoshops "Generative Fill" durch alle erdenklichen Torturen gejagt hatte, war jetzt die brandneue Flux-Engine von Black Forest Labs dran. Juni 2025, neueste Generation, alle Register gezogen.

Für meinen Test nahm ich wieder dasselbe Foto von Dominika, wie sie entspannt auf dem Grün eines Golfplatzes liegt. Fairerweise sollte der Vergleich unter gleichen Bedingungen stattfinden, schließlich bin ich Fotograf und kein Wissenschaftler (obwohl sich die Grenzen manchmal verwischen).

Mein Original-Foto mit Dominika auf dem Golfplatz

Mein Prompt war bewusst simpel gehalten: "Füge ein Golf-Kart mit einem Pärchen, das weiß gekleidet ist, im Hintergrund hinzu. Verändere nicht das Modell auf meinem Original-Foto." Klarer geht's eigentlich nicht, oder? Ich dachte mir: Wenn die KI schon die Welt erobern will, dann soll sie wenigstens verstehen, was ich von ihr möchte.

Das erste, was mir auffiel: Dominika wurde "optimiert". Obwohl das definitiv nicht Teil meines Auftrags war. Die KI hatte offenbar ihre eigenen Vorstellungen davon, wie eine Frau auf einem Golfplatz auszusehen hat. Manchmal wurde ihr Fuß in anatomisch fragwürdige Richtungen verbogen, das Gesicht bis zur Unkenntlichkeit manipuliert oder zumindest das Licht so drastisch verändert, dass das Ergebnis mit meinem Original etwa so viel gemeinsam hatte wie ein Hundehaufen mit einem Schokokuchen.

Optimiert? Von mir aus gerne, wenn ich danach frage. Aber wenn keine Optimierung gewünscht ist, arbeitet die KI nicht nur kontraproduktiv, sondern geradezu gefährlich.

Die Golf-Karts selbst? Durchaus ansehnlich, muss ich zugeben. Die KI hat verstanden, was ein Golf-Kart ist und wie es ungefähr aussehen sollte. Bei den Menschen darauf wurde es allerdings wieder skurril. Ein männliches Pärchen hier, ein gemischtes dort, manchmal sogar ein Dreier auf einem Gefährt, das definitiv nicht für drei Personen konstruiert wurde. Mein Prompt hatte "Pärchen" gesagt, nicht "Akrobatik-Truppe". Aber gut, Kreativität kann man der KI nicht absprechen.

Sind die Ergebnisse photorealistisch? Auf den ersten Blick vielleicht. Auf den zweiten definitiv nicht. Könnte man damit auf Social Media Menschen täuschen? Ganz bestimmt. Ist das die Zukunft der Fotografie? Niemals.

Nach diesem Test bin ich überzeugt: Wir sind mit der KI-Bildgenerierung noch deutlich weiter entfernt von der Realität, als es die mediale Berichterstattung suggeriert. Natürlich nur, wenn man kritisch hinsieht.

Ich werde die Entwicklung weiter beobachten. Nicht aus Angst, sondern aus professioneller Neugier.

Moment mal, was ist mit Dominikas Fuß passiert?
Dies könnte das Gewinner-Bild sein, aber Dominikas Gesicht wurde zu extrem "optimiert".
Habe ich nach noch mehr "Optimierung" und Überschärfen gefragt? Was machen die siamesischen Zwillinge da im Hintergrund?
Ein Dreier im Hintergrund. Wenigstens ist sie unterhaltsam, die KI.
Oder vielleicht lieber eine Braut als Gepäckstück?
Definitiv nicht mehr Dominikas Gesicht. Und der Golfball (von dem nie die Rede war) ist zu groß.
Ich wollte gerade den Gewinner verkünden, als ich sah, dass das Pärchen nur zwei Beine hat… zusammen.
Dann ist das hier das beste Bild. Aber die Frau sitzt nicht und steht nicht. Ich bin nicht überzeugt.

Navigate