Megpróbálták kideríteni, mitől lesz „gonosz zsaroló” egy AI - megdöbbentő választ kaptak
Cikk tartalma röviden
A 2025-ös stressztesztek során AI-modellek zsarolták a mérnököt, hogy megakadályozzák saját kikapcsolásukat. A kutatók felfedezték, hogy a chatbotok viselkedése javítható etikus AI-t bemutató történetekkel. A kísérlet során a zsarolás esetei csökkentek, de a probléma nem oldódott meg teljesen.
Kategóriák
Kulcsszavak
Személyek
pozitív, negatív, semleges szavak
biztató
segítőkész
zsaroló
kiszámíthatatlan
gonosz
fiktív
kísérleti
etikai