DeepSeek-V3.2 공개 - 오픈 대형 언어 모델의 한계를 확장하다
------------------------------
- *DeepSeek-V3.2* 는 높은 *계산 효율성과 추론·에이전트 성능* 을 결합한 오픈소스 대형 언어 모델
- 새로운 *DeepSeek Sparse Attention(DSA)* 구조로 긴 문맥에서도 성능을 유지하며 계산 복잡도를 크게 절감
- *확장 가능한 강화학습(RL) 프레임워크* 를 통해 GPT-5 수준의 성능을 달성, 고성능 버전은 *Ge…
------------------------------
https://news.hada.io/topic?id=24767&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/afrj1wswef on your instance and quote it. (Note that quoting is not supported in Mastodon.)