스토리 · 연속 13일 · 2026-05-03 ~ 2026-05-17

llama.cpp b8926: WebGPU SSM_SCAN 지원 추가

13개 기사Inference · Performance · Infra

타임라인

2026-05-15
로컬 LLM 추론 라이브러리 꾸준히 업데이트 중.
- github.com/ggml-org/llama.cpp/releases/tag/b8986
2026-05-14
llama.cpp가 로컬 추론 최적화 계속하고 있어요.
- github.com/ggml-org/llama.cpp/releases/tag/b8990
2026-05-13
로컬 LLM 추론 라이브러리 꾸준히 업데이트 중이에요.
- github.com/ggml-org/llama.cpp/releases/tag/b8977
2026-05-12
로컬 LLM 추론 라이브러리 매일 패치로 안정화되고 있어요.
- github.com/ggml-org/llama.cpp/releases/tag/b8981
2026-05-11
llama.cpp가 GPU 최적화 계속 밀어붙여 로컬 추론 안정성 높여요.
- github.com/ggml-org/llama.cpp/releases/tag/b8960
2026-05-10
llama.cpp 연속 업데이트로 로컬 추론 안정성 올라가고 있어요.
- github.com/ggml-org/llama.cpp/releases/tag/b8964
2026-05-08
llama.cpp가 Gemma4 등 최신 모델 지원 강화 중.
- github.com/ggml-org/llama.cpp/releases/tag/b8950
2026-05-07
로컬 LLM 서버가 멀티모달 API 호환되면서 쓰임새 넓어져요.
- github.com/ggml-org/llama.cpp/releases/tag/b8952
2026-05-05
로컬 LLM 돌리는 데 필수 인프라 계속 개선 중.
- github.com/ggml-org/llama.cpp/releases/tag/b8941
2026-05-03
로컬·웹 LLM 인프라 핵심 프로젝트 지속 업데이트 중이에요.
- github.com/ggml-org/llama.cpp/releases/tag/b8926