Фабијан Стелсер неодамна спроведе тест споредувајќи три различни генератори на AI (вештачка интелигенција) кои пренесуваат текст на фотографии. Тоа се DALL-E, Midjourney и Stable Diffusion.
“Beatles lego set, catalogue photograph”
funny how this immediately also pulls 60s color schemes pic.twitter.com/XXZ1BPCew8
— fabians.eth (@fabianstelzer) August 20, 2022
Стелсер ги објави резултатите на својот профил на Твитер, каде што го објасни процесот што се користи. Ова вклучува давање идентични упатства за секоја машина и користење на сооднос 1:1.
“Pixar movie scene of a dark skull wizard fighting against Kermit the frog as a gladiator, incredible render, Presto”
DALL-E’s usually my go to for scenes involving 2 or more clear “actors” – will be cool to render battle scenes for my prompt fighting game @battleprompts pic.twitter.com/hSVDuqH8wp
— fabians.eth (@fabianstelzer) August 20, 2022
Фасцинантниот експеримент дава увид во тоа како секој генератор на вештачка интелигенција ги толкува инструкциите и дава индиции за целокупниот стил на секоја од машините.
MJ does “historical” / worn photos really well though pic.twitter.com/tZs4rssHN2
— fabians.eth (@fabianstelzer) August 20, 2022
Забележано е дека Midjourney има постојан, помрачен стил во споредба со другите две AI. Од друга страна, DALL-E 2 и Stable Diffusion создаваат многу пореални слики.
Исто така, додека Midjourney не може да создаде фотореалистична фотографија, Stable Diffusion нуди најдобри резултати на ова поле.