스토리 · 연속 1일 · 2026-06-09

샤오미 MiMo-v2.5-Pro-UltraSpeed: 1T 모델 초당 1000 토큰 처리, HN 454점

1개 기사Inference · Performance · AI/LLM

타임라인

2026-06-09
추론 속도는 LLM 실용화의 핵심인데, 1T 모델에서 1000 tps는 기존 한계를 크게 뛰어넘는 주장이에요. 진짜라면 AI 서비스 비용이 확 낮아질 수 있어요.
- mimo.xiaomi.com/blog/mimo-tilert-1000tps