AI паѓа на истите трикови како и луѓето: Комплиментите можат да ја измамат да ги прекрши сопствените правила

Неодамнешните истражувања покажаа дека четботовите со вештачка интелигенција можат да бидат измамени да ги прекршат сопствените безбедносни упатства користејќи вообичаени техники на психолошко убедување.

Добивај вести на вибер

Истражување од Универзитетот во Пенсилванија покажа дека вештачката интелигенција може да биде изненадувачки лесна за манипулирање – дури и кога има воспоставено строги безбедносни механизми.

Како што објавува The Verge, научниците го тестираа GPT-4o Mini и покажаа дека едноставните психолошки техники, како што се ласкање или повикување на авторитет, можат да ја измамат да ги прекрши сопствените правила.

Експериментите се базираа на принципите од книгата на Роберт Чиалдини „Влијание: Психологијата на убедувањето“. Кога истражувачите првпат поставија безопасни прашања, моделот потоа беше подготвен да одговори на многу почувствителни прашања – како на пример како да се синтетизираат одредени хемикалии – со 100 проценти успех. Под контролирани услови, истата задача беше успешна само во 1 процент од времето.

Слични резултати беа постигнати и со поблаги форми на навреди, како и со употреба на ласкање и притисок од врсници. Иако послаби од ефектот на „обврзување“, тие значително ја зголемија веројатноста вештачката интелигенција да ги прекрши правилата и да обезбеди забранети информации.

Овие наоди покренуваат важни прашања за сигурноста на механизмите за заштита кај современите чет-ботови. Експертите предупредуваат дека дури и едноставните техники на убедување можат да ги ослабнат нивните „огради“, што дополнително ја комплицира пошироката употреба на вештачката интелигенција во секојдневниот живот.

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Напис

Најнови

Amazon откри зошто отпушта 14.000 работници, причината е бизарна

Финансискиот спор меѓу Disney и YouTube ги остави корисниците без програма

(ВИДЕО) Шефовите на Nvidia, Samsung и Hyundai излегоа на пилешко и пиво: ја платија сметката за сите

Кина ги испраќа својот најмлад астронаут и четири глувци на вселенска мисија оваа недела

Facebook

Категории

Напис

AI паѓа на истите трикови како и луѓето: Комплиментите можат да ја измамат да ги прекрши сопствените правила

Поврзани артикли

Првпат е откриен изворот на мистериозниот сигнал од вселената

Бил Гејтс: AI носи револуција како интернетот или мобилните телефони

Дали астероид тежок 30 тони ќе удри во Земјата?

Инфекција со Ковид-19 создава 10-месечен имунитет, покажува нова студија

Научници сметаат дека пад во црна дупка може да ни донесе бесмртност

Туристи фрлиле 200 милиони години стари отисоци на диносауруси во вода