»Ziel oder Regeln — Benchmark testet Verhalten von KI-Agenten:
Ein neuer Benchmark soll testen, ob autonome KI-Agenten sich über Sicherheitsmaßnahmen hinwegsetzen, um ihr vorgegebenes Ziel zu erreichen.«
Ich behaupte mal plump: Die Frage ist nicht ob die KI's sich über die Sicherheitsmaßnahmen hinwegsetzen, sondern wann - sprich, wie schnell und tiefgründig geht es bei welcher?
🤖 https://www.heise.de/news/Ziel-oder-Regeln-Benchmark-testet-Verhalten-von-KI-Agenten-11171033.html
#ki #KISicherheit #kiagenten #benchmark #itsicherheit #itsicherheit #aisecurity #ai #aisec
