애플이 한 몇개월전에 공개했던 LLM 툴/함수 호출 테스트 벤치마크가 있는데 한마디로 이건 애플이 그동안 광고하는 그 애플 인텔리전스가 가능한가 테스트해보는 그런 프레임워크였던것 같다음 사용자 요청을 받아서 적절히 폰의 기능을 호출해서 처리하나 못하나 이걸 보는것인데 대부분 잘되는데 아주 상식적인것들 몇개가 잘 안 됨... 아마 그래서 애플이 밍기적거리는것 아닌가 싶고?

0

If you have a fediverse account, you can quote this note from your own instance. Search https://bsky.brid.gy/convert/ap/at://did:plc:owujq5v3xne4awdkgrnizz6w/app.bsky.feed.post/3lu7aefdu4k2n on your instance and quote it. (Note that quoting is not supported in Mastodon.)