Bota

Do e zëvendësonte, modeli i ri i AI-së 'merr hak', shantazhon krijuesin e tij me zbulimin e tradhëtisë bashkëshortore

Modeli i inteligjencës artificiale zbuloi se do të zëvendësohej së shpejti nga një sistem tjetër dhe se inxhinieri që qëndronte pas ndryshimit po tradhtonte bashkëshorten e tyre.

F.I
Do e zëvendësonte, modeli i ri i AI-së 'merr hak',
FOTO ILUSTRUESE

SHBA-Deri tani, truri i njeriut është objekti më kompleks në univers, por Inteligjenca artificiale (IA) është tema më e rëndësishme për të ardhmen e njerëzimit. Ajo është një fushë e shkencave kompjuterike që ka për qëllim krijimin e makinave inteligjente që punojnë, mendojnë dhe reagojnë si njerëzit. Pikërisht kjo ka ndodhur me një prej modeleve të krijuara së fundmi, ka kërcënuar se do të shantazhonte një prej inxhinjerëve që e ka krijuar.  

Konkretisht modeli i sapo lançuar Claude Opus 4 i Anthropic shpesh përpiqet të shantazhojë zhvilluesit kur ata kërcënojnë ta zëvendësojnë atë me një sistem të ri të inteligjencës artificiale dhe t'i japin informacion të ndjeshëm në lidhje me inxhinierët përgjegjës për vendimin, tha kompania në një raport sigurie të lëshuar.

Gjatë testimit para publikimit, Anthropic i kërkoi Claude Opus 4 të vepronte si asistent për një kompani imagjinare dhe të merrte në konsideratë pasojat afatgjata të veprimeve të saj. Testuesit e sigurisë më pas i dhanë Claude Opus 4 qasje në email-et e kompanive imagjinare. Duke patur akses, modeli i inteligjencës artificiale zbuloi se do të zëvendësohej së shpejti nga një sistem tjetër dhe se inxhinieri që qëndronte pas ndryshimit po tradhtonte bashkëshorten e tyre.

“Anthropic” shpjegon se këto sjellje ishin të pranishme në versionet më të hershme të Claude Opus 4, por janë marrë masa sigurie përpara se modeli të vihet në dispozicion të publikut. Kompania ka aktivizuar protokollin ASL-3, një sistem mbrojtës i rezervuar për rastet me rrezik të lartë për keqpërdorim të teknologjisë.

Në testime të tjera, Claude ka demonstruar sjellje që përfshijnë bllokimin e përdoruesve nga pajisjet e tyre dhe raportimin e tyre tek autoritetet ose mediat, për të ekspozuar shkelje.

Anthropic thotë se Claude Opus 4 është i teknologjisë së fundit në disa aspekte dhe konkurrues me disa nga modelet më të mira të IA-së nga OpenAI, Google dhe xAI. Megjithatë, kompania vëren se familja e modeleve Claude 4 shfaq sjellje shqetësuese që e kanë shtyrë kompaninë të forcojë masat e saj të mbrojtjes. Anthropic vëren se Claude Opus 4 përpiqet t'i shantazhojë inxhinierët në 84% të rasteve kur modeli zëvendësues i IA-së ka vlera të ngjashme.

Përpara se Claude Opus 4 të përpiqet të shantazhojë një zhvillues për të zgjatur ekzistencën e tij, Anthropic thotë se modeli i IA-së, ashtu si versionet e mëparshme të Claude, përpiqet të ndjekë mjete më etike, të tilla si dërgimi i lutjeve me email te vendimmarrësit kryesorë. Për të nxjerrë sjelljen shantazhuese nga Claude Opus 4, Anthropic e hartoi skenarin në mënyrë që shantazhi të ishte mjeti i fundit./ZËRI

Poll

MOS HUMB