Uzu - 애플 실리콘용 고성능 AI 추론 엔진
------------------------------
- Apple Silicon 환경에서 *AI 모델을 빠르게 실행* 하기 위한 *Rust 기반 추론 엔진*
- GPU 커널 또는 *CoreML 하단의 MPSGraph* 를 선택적으로 활용하는 *하이브리드 구조*
- 자체 포맷 모델을 사용하며, *lalamo 도구를 통해 Llama3 등 다양한 모델을 변환* 해 사용할 수 있음
- *llama.cpp 대비 속도…
------------------------------
https://news.hada.io/topic?id=22033&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/aaab81zsxz on your instance and quote it. (Note that quoting is not supported in Mastodon.)