これ興味深い内容だな。AIに価値判断をさせる。

https://x.com/ho4not/status/2028067383165043198

AnthropicはConstitutional AIという手法を採っています。これは簡単に言えば、「ルールの集合」ではなく「価値観」をAIに埋め込もうとするアプローチです。「これを言ってはいけない」というブラックリストではなく、「正直であること」「有害でないこと」「有益であること」を原則として、AIが自ら判断できるようにする。

これは、「編集」の機能をAIの内部に組み込もうとする試みに近いかもしれません。何を伝え、何を伝えないか。どこまで踏み込み、どこで止まるか。その判断を、アルゴリズムの自動最適化ではなく、何らかの「価値判断」に基づいて行う。

0

If you have a fediverse account, you can quote this note from your own instance. Search https://hollo.tenjuu.net/@tenjuu99/019cb1b8-50f5-78a9-b198-8e653eb3a7da on your instance and quote it. (Note that quoting is not supported in Mastodon.)