GPU에 대한 기본 팩트들
------------------------------
-
GPU 는 연산 속도가 메모리 접근 속도보다 월등히 빨라서, *메모리 계층 구조* 가 성능의 병목을 일으킴
- *연산 집약도(Arithmetic Intensity, AI)* 에 따라 연산이 메모리 바운드, 계산 바운드 상태로 구분되며,
A100 GPU의 임계점은 약 13 FLOPs/Byte임
- *성능 최적화* 주요 전략으로 연산 합치기(Fusio…
------------------------------
https://news.hada.io/topic?id=21644&utm_source=googlechat&utm_medium=bot&utm_campaign=1834

0

If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/a9gafq4r7o on your instance and quote it. (Note that quoting is not supported in Mastodon.)