Step 3.5 Flash – 고속 추론을 지원하는 오픈소스 LLM
------------------------------
- 1960억 매개변수 중 110억만 활성화하는 *희소 Mixture of Experts 구조* 로, 고속 추론과 실시간 상호작용을 지원
- 초당 최대 350토큰의 생성 속도와 256K 컨텍스트 윈도우를 구현
- *SWE-bench Verified 74.4%* 로 코딩·에이전트 벤치마크에서 안정적 성능을 보이며, *로컬 환경(Mac Studio M4 Max, NVIDIA…
------------------------------
https://news.hada.io/topic?id=26834&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/aiy0g5z09d on your instance and quote it. (Note that quoting is not supported in Mastodon.)