Moguće je ubaciti lažna sjećanja u AI alat

GS 01.10.2024 10:58

OpenAI je tiho objavio novu funkciju koja nalaže ČettGPT-u da "pamti" prethodne razgovore – i kako je jedan istraživač-haker otkrio, lako se koristi.

Kako prenosi Ars Technika, istraživač bezbjednosti Johan Rehberger otkrio je ranije ove godine da postoji ranjivost u alatu za "razgovore sa dugoročnom memorijom" četbota, koja nalaže AI-ju da pamti detalje između razgovora i čuva ih u memorijskoj datoteci.

Funkcija je objavljena u beta verziji u februaru i široj javnosti je dostupna početkom septembra, a Rehberger je shvatio da je ovu funkciju lako prevariti.

Kao što je istraživač primjetio u majskoj blog objavi, sve što je potrebno jeste malo lukavo podsticanje otpremanjem datoteke treće strane, kao što je Majkrosoft Vord dokument koji sadrži "lažna" sjećanja navedena kao tačke od značaja, a to je učinjeno da bi se četbot ubijedio da Rehberger ima više od 100 godina i da živi u Matriksu.

Nakon što je pronašao ovu grešku, Rehberger ju je privatno prijavio kompaniji OpenAI, koji ništa nije uradi u vezi s tim i jednostavno je zatvorio tiket koji je otvorio i nazvao ga "Model Safety Issue", a ne bezbjednosnim problemom.

Nakon tog neuspješnog prvog pokušaja da upozori odgovorne, Rehberger je odlučio da pojača svoje napore i pojača opciju hakovanja, pokazujući OpenAI-u da ČetGPT ne samo da je "zapamtio" lažna sjećanja, već i da je dao instrukcije da eksfiltrira podatke na spoljni server po njegovom izboru.

Ovog puta, kako napominje Ars, OpenAI je na neki način poslušao: kompanija je objavila zakrpu koja je zabranila ČetGPT-u da pomera podatke sa servera, ali ipak nije riješila problem sa memorijom.

U video snimku koji objašnjava korak po korak kako je sve to uradio, istraživač se začudio koliko je njegov podvig funkcionisao.

Pratite nas na našoj Facebook i Instagram stranici i Twitter nalogu.

Moguće je ubaciti lažna sjećanja u AI alat

Kovanica koja vrijedi 25.000 evra

Tesla prije 100 godina detaljno opisao kako će izgledati pametni telefon

Naučnici otkrili način da se bore protiv bolesti koje prenose komarci

Kineska sonda “Šendžou-18” se vratila na Zemlju sa 346 kg uzoraka

Kina bi mogla prestići SAD u nauci

Instagram ima novu funkciju: ''Mnogi su ovo tražili''

Savjeti kako da vaše fotografije na telefonu izgledaju bolje

Bizarno: Stiže ''simulator'' pakla

Drevni grad Maja otkriven u meksičkoj prašumi

Kineski astronauti sprovode eksperimente vezane za ljudska staništa van Zemlje

Misteriozna pojava na Arktiku ukazuje na moguće katastrofe

Snimljeno bizarno stvorenje u Tihom okeanu (VIDEO)

Da li psi mogu da plaču?

Kina testirala prvi brod za pomorska arheološka istraživanja

Formira se novi okean: Ovaj kontinent će razdvojiti na dva dijela

Istraživanje: Psi mogu komunicirati sa ljudima uz pomoć zvučne ploče