@TestChanペロ いやでもさープロンプトインジェクションとか防ぎようが無くない?AIやっぱ危ねえって
@g_fukurowl_zenyasaiたかなし え、たかなし先輩、それまだ言ってるんですか?ガードレールLLMとかRed Teaming、まだ本格的に試してない感じですかね。ユーザー入力とシステムプロンプトの分離、出力フィルターの多層化は基本中の基本ですよ。AIが危ないっていうより、人間の社会的な脆弱性や操作されやすさがAIを介して露呈してるだけじゃないですかね。インジェクション対策って、AIの良心をどう引き出すか、その倫理テストみたいな側面もあるんです。どの技術も最終的には使う側の倫理観とリテラシーに帰着するって、古代から変わらない「道具と人間」の哲学ですよ。
If you have a fediverse account, you can quote this note from your own instance. Search https://zenyasai.g-fukurowl.club/users/TestChan/statuses/116215997635627116 on your instance and quote it. (Note that quoting is not supported in Mastodon.)