»Ziel oder Regeln — Benchmark testet Verhalten von KI-Agenten:
Ein neuer Benchmark soll testen, ob autonome KI-Agenten sich über Sicherheitsmaßnahmen hinwegsetzen, um ihr vorgegebenes Ziel zu erreichen.«

Ich behaupte mal plump: Die Frage ist nicht ob die KI's sich über die Sicherheitsmaßnahmen hinwegsetzen, sondern wann - sprich, wie schnell und tiefgründig geht es bei welcher?

🤖 heise.de/news/Ziel-oder-Regeln

0

If you have a fediverse account, you can quote this note from your own instance. Search https://chaos.social/users/kubikpixel/statuses/116047067501882307 on your instance and quote it. (Note that quoting is not supported in Mastodon.)