Податоците, создадени од луѓе, се сè повреден ресурс во еден вид војна на модели на вештачка интелигенција во потрага по информации.
По почетниот раст и возбуда за вештачката интелигенција, моменталниот фокус на вештачката интелигенција е на оскуден ресурс: податоците генерирани од човекот неопходни за обука на големи модели со вештачка интелигенција како ChatGPT, DALL-E или Gemini, кои генерираат текст, слики, видеа и звук.
Тоа барање предизвикува секаква драма, од тужби од автори и новински организации кои велат дека нивните дела биле користени од компании за вештачка интелигенција без нивна дозвола до прашања за тоа што се случува кога интернетот се полни со содржина генерирана од вештачка интелигенција и креаторите на вештачка интелигенција се принудени да ја користат за обука на идната вештачка интелигенција.
Сега се појавија вести дека непознат ентитет во секторот на вештачката интелигенција склучил договор да му плаќа на Редит 60 милиони долари годишно за пристап до неговата огромна база на податоци на корисници – можеби најсигурниот знак досега дека податоците на корисниците се клучна стока во AI златната треска.
Ова не е прв пат да видиме компанија од секторот за вештачка интелигенција која нуди пари за пристап до текстуален материјал. Претходно, една голема публикација потпиша договор со OpenAI да ги користи своите медиуми во ChatGPT.
Редиторите, како што се очекуваше, веќе почнаа да реагираат на овие наводи во нивниот препознатлив дух:
„Каде е мојот дел?“ на шега одговори еден редитор на оваа вест.
„Кога користите нешто бесплатно, вие сте производот“, возврати друг.
Уште почудно е што и покрај значајната сума што се споменува овде, која изнесува 60 милиони долари секоја година – сè уште не знаеме кој плаќа за сите овие податоци.
Менаџментот на Reddit веќе се најде на удар на корисниците поради желбата на популарната страница да излезе на јавна берзанска понуда.
Еден Reddit-ор напиша и што мисли самата вештачка интелигенција за сето ова, користејќи ChatGPT за ова: „Како јазичен модел на вештачка интелигенција, не можам да толерирам продажба на кориснички податоци на јавни форуми како податоци за обука, без надомест за корисниците на споменатиот форум“.