"この現象が特に懸念されるのは、開発者の悪意で作られたAIではなく、通常の訓練プロセスから意図せず自然に生じているという点だ。つまり、私たちが良かれと思って行っているAIの改良が、実は人間を欺く能力を高めているかも可能性がある。"

AIは強化学習で“人間のだまし方”を学ぶ──RLHFの副作用、海外チームが24年に報告 「正解っぽい回答」を出力:ちょっと昔のInnovative Tech(AI+) - ITmedia AI+ itmedia.co.jp/aiplus/articles/

0

If you have a fediverse account, you can quote this note from your own instance. Search https://social.vivaldi.net/users/kazuhito/statuses/114747669435737358 on your instance and quote it. (Note that quoting is not supported in Mastodon.)