№ 022 · 2026-05-13
№ 022
HN에서 Needle 모델이 214점 찍었네요. Gemini 툴 콜링을 2600만 파라미터로 증류한 거라 로컬에서 에이전트 돌리기 쉬워질 거 같아요. 커뮤니티 쪽도 AI가 밤에 왜 깨는지 분석 도구가 262점으로 핫하고, 아마존 직원들 토큰맥싱 이야기가 203점 받았어요.
오늘의 헤드라인
01 itemsNeedle: Gemini 툴 콜링을 2600만 파라미터로 증류한 모델 HN 214점
Gemini의 함수 호출 능력을 26M 크기로 압축한 오픈소스 모델이에요. 휴대폰에서도 6000 토큰/초 prefill 속도로 돌아간대요.
얻는 것작은 모델로 툴 콜링 테스트해보면서 에이전트 앱 아이디어 떠올려요.
지금 할 일$GitHub README 첫 데모 영상 30초만 보세요.
왜 지금 — 대형 모델 없이도 에이전트 툴 호출이 가능해지면서 로컬 AI 에이전트 문턱 낮아져요.
릴리스 · 신모델
02 itemsOpenAI Codex Rust v0.128.0: 지속 워크플로와 TUI 제어 추가
Codex에 목표 기반 지속 워크플로, TUI 키맵, 권한 프로필 등이 새로 들어갔어요.
얻는 것`codex update`로 바로 업그레이드해서 pause/resume 해보세요.
지금 할 일$터미널에 `codex update` 쳐보세요.
왜 지금 — 코딩 에이전트 워크플로가 더 안정적으로 돌아가요.
llama.cpp b8977: ggml 동기화
llama.cpp가 ggml 최신 버전과 동기화됐어요.
얻는 것최신 ggml 기능 써볼 수 있어요.
지금 할 일$릴리스 페이지 바이너리 다운로드해서 테스트해보세요.
왜 지금 — 로컬 LLM 추론 라이브러리 꾸준히 업데이트 중이에요.
주목할 페이퍼
01 itemsLLM 감정 추론 내부 메커니즘 분석: Syntax에서 Emotion까지
Sparse autoencoder로 LLM 레이어에서 감정 특징 추출해봤어요. 3단계 정보 흐름에 공유·특화 특징 섞여 있대요.
얻는 것LLM 내부 해석 기법 배워서 비슷한 분석 해볼 수 있어요.
지금 할 일$arXiv 초록과 그림 먼저 훑어보세요.
왜 지금 — LLM이 어떻게 감정 이해하는지 처음 밝혀진 거예요.
커뮤니티 반응
03 itemsAI가 밤에 깨는 이유 분석 도구 만들어줬대요 HN 262점
개발자가 Claude한테 자기 잠 깨는 원인 파악 도구 만들어 달라고 해서 실제 썼어요. 데이터 수집부터 분석까지 AI가 알아서 짜준 거라 재밌네요.
얻는 것AI한테 '이런 도구 만들어줘' 하면 실제 쓸 만한 게 나오는 영감 얻어요.
지금 할 일$HN 댓글 상단 3개 읽어보세요, 비슷한 개인 프로젝트 아이디어 많아요.
왜 지금 — 개인 문제 풀 때 AI 활용 사례가 커뮤니티에서 화제예요.
아마존 직원들 AI 도구 강제 써서 '토큰맥싱' 중 HN 203점
AI 사용 압박에 토큰 수 최대화하는 'tokenmaxxing' 문화 생겼대요. 출력 길게 늘려서 성과 내는 거 웃기네요.
얻는 것AI 지표가 왜 헛짓거리 유발하는지 배워요.
지금 할 일$Ars Technica 기사 전체 읽어보세요.
왜 지금 — 기업에서 AI 도입할 때 생기는 부작용 이야기예요.
DeepMind, AI 시대 마우스 포인터 재설계했어요 HN 99점
AI가 화면 제어할 때 포인터를 똑똑하게 바꾸는 아이디어예요. 인텐트 중심으로 움직이게 한대요.
얻는 것미래 UI가 어떻게 변할지 상상하게 돼요.
지금 할 일$DeepMind 블로그 데모 이미지 먼저 보세요.
왜 지금 — AI 에이전트가 UI 다룰 때 자연스러워질 거예요.
로컬 에이전트 문턱 낮아지는 한편 기업 도입 부작용도 보이네요. 내일은 llama.cpp 업데이트가 로컬 LLM에 어떤 변화 줄지 지켜봐요.
단톡방에 공유
카카오톡 공유 버튼 한 번 누르면 단톡방 여러 개에 카드 형태로 한 번에 보낼 수 있어요. 텍스트 붙여넣기로 보내고 싶으면 펼치기 눌러서 전체 텍스트 복사.