GLM-5 공개 : 복잡한 시스템 엔지니어링과 장기 에이전트 작업을 목표로 하는 모델
------------------------------
- 인공지능 *효율성과 장기적 작업 수행 능력* 을 강화한 대규모 언어모델
- 전작 대비 *매개변수 7440억 개(활성 400억)* 로 확장되고, *사전학습 데이터 28.5조 토큰* 으로 증가
- *DeepSeek Sparse Attention(DSA)* 통합으로 긴 문맥 처리 능력을 유지하면서 *배포 비용을 절감*
- 새로운 *비동기 강…
------------------------------
https://news.hada.io/topic?id=26611&utm_source=googlechat&utm_medium=bot&utm_campaign=1834

0

If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/aimcxjhu4l on your instance and quote it. (Note that quoting is not supported in Mastodon.)