AI의 장기 작업 수행 능력 측정
------------------------------
- *AI 모델이 완전하게 수행할 수 있는 작업의 ‘길이’* 를 기준으로 성능을 측정하는 새로운 지표가 제시됨
- 지난 *6년간 AI가 자율적으로 완수할 수 있는 작업 길이가 약 7개월마다 두 배로 증가* 한 것으로 분석됨
- 인간 전문가가 4분 이내에 끝내는 작업은 거의 100% 성공하지만, *4시간 이상 걸리는 작업은…
------------------------------
https://news.hada.io/topic?id=25259&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/aglifadl2a on your instance and quote it. (Note that quoting is not supported in Mastodon.)