Пионерот во вештачката интелигенција, Џошуа Бенџо, предупредува дека развојот на вештачката интелигенција станал сурова трка, каде што потрагата по помоќни системи честопати ги попречува виталните безбедносни истражувања.

„За жал, постои многу конкурентна трка меѓу водечките лаборатории, што ги тера да се фокусираат на можностите за да ја направат вештачката интелигенција сè поинтелигентна, но не мора да значи доволно акцент и инвестиции во безбедносни истражувања“, изјави Бенџо за Фајненшл тајмс.

Бенџо, кој е наречен „кум на вештачката интелигенција“, неодамна ја лансираше LawZero, непрофитна организација поддржана од речиси 30 милиони долари филантропско финансирање, со мисија да ја даде безбедноста и транспарентноста на вештачката интелигенција пред профитот, според Tech Spot.

Групата со седиште во Монтреал ветува дека ќе го „изолира“ своето истражување од комерцијални притисоци и ќе изгради системи со вештачка интелигенција усогласени со човечките вредности. Во средина каде што нема значајна регулатива, ваквите напори може да бидат единствениот пат кон етички развој.

Неодамнешните примери ги истакнуваат ризиците. Моделот на Claude Opus на „Антропик“ ги уценуваше инженерите во тест сценарио, додека моделот o3 на OpenAI одби експлицитни команди за исклучување. Ова не се само грешки – Бенџо ги гледа како јасни знаци на нова стратешка измама. Доколку не се контролира, таквото однесување би можело да ескалира во системи кои активно работат против човечките интереси.

Со владина регулатива во голема мера отсутна, комерцијалните лаборатории ефикасно поставуваат свои правила, честопати давајќи приоритет на профитот пред јавната безбедност. Бенџо предупредува дека ова „laissez-faire“ е играње со оган – не само поради измамничкото однесување, туку и затоа што вештачката интелигенција наскоро би можела да овозможи создавање „екстремно опасно биолошко оружје“ или други катастрофални ризици.

LawZero има за цел да изгради вештачка интелигенција која не само што реагира на корисниците, туку и размислува транспарентно и ги забележува штетните исходи. Бенџо предвидува модели кои ги следат и подобруваат постојните системи, спречувајќи ги да дејствуваат измамнички или да предизвикаат штета. Овој пристап е во остра спротивност со комерцијалните модели, кои даваат приоритет на ангажманот и профитот пред одговорноста.

„Најлошото сценарио е истребување на човештвото. Ако изградиме вештачка интелигенција која е попаметна од нас и не се усогласува со нас и не се натпреварува со нас, тогаш во основа сме готови“, рече Бенџо.