Има нов „жежок“ тренд на полето на вештачката интелигенција: генератори на текст во слики. Сè што треба да направите е да внесете текстуален опис на она што сакате да го видите и овие програми ќе генерираат слики што одговараат на тој опис.
Овие слики можат да бидат во различни стилови – може да изгледаат како CGI рендер или вистинска фотографија. Звучи клише, но единственото ограничување е вашата имагинација.
До денес, лидер во оваа област е DALL-E, програма создадена од комерцијалната лабораторија за вештачка интелигенција OpenAI. Пред неколку дена, сепак, Google ја објави својата верзија на овој вид софтвер Imagen, а сега DALL-E има сериозен конкурент.
Најдобар начин да се разбере неверојатната способност на овие модели на вештачка интелигенција е едноставно да се погледнат некои од сликите што тие можат да ги генерираат.
Во овие примери, текстот на дното на сликата беше опис внесен во програмата, а сликата погоре е она што вештачката интелигенција го создаде врз основа на тој текст. Тоа е сè што е потребно – запишете што сакате да видите и програмата го генерира.
Но, иако овие слики се неспорно импресивни во нивната кохерентност и точност, треба да имате и здрава доза на скептицизам. Кога истражувачките тимови како Google Brain објавуваат нов модел на вештачка интелигенција, тие имаат тенденција да ги изберат најдобрите резултати.
Така, иако сите овие слики изгледаат исклучително добро, тие можеби не го претставуваат просекот на овој систем.
Честопати, сликите генерирани од вештачката интелигенција изгледаат недовршени, размачкани или заматени.
Во секој случај, ова е фасцинантен пример за тоа што можеме да очекуваме од оваа технологија.