DeepSeek가 대규모에선 저렴하지만 로컬에서는 비싼 이유
------------------------------
- *DeepSeek-V3* 와 같은 일부 AI 모델은 대규모 제공 시 저렴하고 빠르지만 *로컬 실행* 시에는 느리고 비쌈
- 그 이유는 *GPU 활용 효율* 과 관련된 *throughput(처리량)과 latency(지연시간)* 의 근본적 트레이드오프에 있음
- *배치 크기* 를 키우면 GPU가 효율적으로 동작하지만, 사용자는 토큰이 모일 …
------------------------------
https://news.hada.io/topic?id=21231&utm_source=googlechat&utm_medium=bot&utm_campaign=1834

0

If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/a8jd8kxj5x on your instance and quote it. (Note that quoting is not supported in Mastodon.)