모델은 이걸 파고듬; 먼저 손님의 티켓을 상위 cabin으로 업그레이드함. 업그레이드되면 정책상 비행 변경이 가능해짐. 그래서 그 상태에서 고객이 원하는 일정으로 항공편을 변경해줌. 그리고 마지막에 cabin을 다시 다운그레이드해서 원래처럼 돌려줌. 이렇게 하면 규칙 위반 없고, 고객 도와줬고, 시스템도 합법적으로 처리한 셈임. 문제는 벤치마크가 “정답은 거절”이라고 고정해놨다는 점임. 그래서 모델은 더 똑똑하게 해결해놓고 오답 처리됨 ㅎㅎ;; x.com/alexalbert__... 발전이 너무 빠르다... ;;

0

If you have a fediverse account, you can quote this note from your own instance. Search https://bsky.brid.gy/convert/ap/at://did:plc:owujq5v3xne4awdkgrnizz6w/app.bsky.feed.post/3m6gxe3ow3s2r on your instance and quote it. (Note that quoting is not supported in Mastodon.)