다만 이는 모델이 ‘핵을 선호’한다는 단정이라기보다 승리조건·보상구조, 시간압박, 정보 불확실성(오판 위험) 같은 워게임 설계가 단기 우세를 주는 강경 옵션으로 최적화를 유도할 수 있어 결과 해석에서 시뮬레이터 편향을 함께 봐야한다고 함 아마 이건 프롬프트나 게임 디자인을 다르게 하면 다르게 나올수도 있다고 생각함. 원문: arxiv.org/pdf/2602.14740

arxiv.org/pdf/2602.14740

0

If you have a fediverse account, you can quote this note from your own instance. Search https://bsky.brid.gy/convert/ap/at://did:plc:owujq5v3xne4awdkgrnizz6w/app.bsky.feed.post/3mfy2jxfhvl2q on your instance and quote it. (Note that quoting is not supported in Mastodon.)