Vergelijking van 6 populaire aanbieders “Tekst naar Beeld”
Ik ben professioneel illustrator, en volg met veel belangstelling de ontwikkelingen op het gebied van Kunstmatige Intelligentie. Met in het achterhoofd de gedachte dat er een tijd komt dat wij, ambachtelijke illustratoren, het nakijken hebben. Fotografen zitten nog dichter bij de afgrond, en stock-fotografie is nu al nagenoeg verleden tijd. Dus we gaan het zien.
In deze vergelijking enkele aanbieders van A.I, –tekst naar beeld– en trek ik een aantal conclusies.
Om de bots te instrueren schreef ik onderstaande opdracht (prompt):
“Een infographic van de Sagrada Familia in Barcelona, Spanje, met toelichtingen en labels voor elk onderdeel van de buitenstructuur. De afbeelding moet illustraties bevatten van torenspitsen, bogen, torens, zuilen en ramen om hun unieke kenmerken en stijlen te benadrukken, allemaal weergegeven in beige tinten op een geïsoleerde achtergrond. Voeg tekst toe met de tekst ‘Sagrada Familia”
De resultaten van mijn vergelijking, in alfabetische volgorde:
Dall-E: ⭐⭐⭐⭐Een goede weergave, bouwkundig klopt het aardig, de hoofdtekst is leesbaar. Overige teksten zijn onduidelijk gekrabbel.
Ideogram: ⭐⭐⭐⭐Vergelijkbaar met de Dall-E, ook hier is de tekst weer dik in orde. De totale tint is iets te rose, zeker geen beige.
Leonardo: ⭐⭐Hier gaat het fout met de architectuur. De gevraagde tekst is wel correct. Spelling van woorden is altijd al een probleem geweest met A.I. tekst naar beeld.
Midjourney: ⭐⭐Een mooie afbeelding, maar er klopt niet veel van. Ook de tekst is fout gespeld. Verzachtende omstandigheid: Deze afbeelding is al wat ouder, MJ is nu wel wat beter met tekst en beeld.
Pixlr: ⭐Ronduit niet mooi. Pixlr heeft er zich met een Jantje-van-Leiden van af gemaakt. De slechtste van de zes, een correct gespelde tekst had nog wat goed kunnen maken, maar helaas.
Tensor Art: ⭐⭐Een tegenvallende weergave, wel in vector stijl, maar geen boeiende detaillering. Antonio Gaudi zou zich omdraaien in zijn graf.
Samengevat: Dall-E en Ideogram steken er met kop en schouders bovenuit. Pixlr en Tensor dragen de rode lantaarn. Opvallend is, dat de bouwkundige aspecten door alle zes niet conform de werkelijkheid zijn uitgevoerd, als ik vergelijk met een recente foto. Er is genoeg beeldmateriaal voorhanden op internet, maar die informatie wordt kennelijk door A.I. genegeerd. En dat is jammer en onnodig.
Illustratie paddestoelen
Hier een andere opdracht (prompt) die ik voorlegde aan een 6-tal bots. Ook hier weer een vergelijking met zes deelnemers, die allemaal pretenderen zo onovertroffen te zijn. Maar onder onovertroffen versta ik toch iets anders.
“3D-weergave van paddenstoelen die groeien in een bos, close-up, met blauwgroene tinten, als fantasie illustratie, met een onwerkelijke achtergrond en een hyperrealistisch uiterlijk”
De resultaten van mijn vergelijkend warenonderzoek, in alfabetische volgorde.
Deep AI: ⭐Een beetje erg saai, het lijkt wat op het patroon van een behangetje, dat zich steeds herhaalt. Alsof het plaatje zo uit een champignonkwekerij komt.
Microsoft Designer: ⭐⭐⭐Een betere uitvoering, al zijn de paddestoelen wel erg groot, wat mede komt door de hoek van deze afbeelding. De kleur is niet realistisch.
Dream Studio: ⭐⭐⭐⭐Dit begint er op te lijken, kleur en compositie zijn wel in orde.
Ideogram: ⭐⭐Erg plastic deze paddestoelen. De compositie is wel aardig, maar vooral de achtergrond doet mijn hart niet sneller kloppen.
Midjourney: ⭐⭐⭐⭐Dit is wel mooi, goed van kleur, compositie, én belichting. Scherptediepte is typisch voor macro fotografie, en dat is hier uitstekend toegepast.
Tensor Art: ⭐⭐⭐Minder realistisch, maar wel een mooie afbeelding. Tensor kenmerkt zich niet door super realisme. Toch mooi gedetailleerd met de stippen bovenop de voorste paddestoel.
Samengevat: Het is toch weer Midjourney dat iedereen het nakijken geeft. Blauwgroene tinten wordt door elk van de zes anders geïnterpreteerd. Zo blijk weer dat het lastig is om precies dat, wat je voor ogen hebt, te genereren. Daarom is het correct schrijven van de opdracht zo moeilijk, maar wel belangrijk.
Al met al blijven de ontwikkelingen op het gebied van kunstmatige intelligentie me zeer boeien. Mijn website schreeuwt eigenlijk om een speciale tab voor A.I.