№ 049 · 2026-06-09
№ 049
애플이 AI 전략을 대대적으로 수정했어요. 구글 제미나이를 기반으로 한 새 아키텍처를 공개하면서 Siri도 함께 개편한다고 하네요. 한편 vLLM이 DeepSeek V4 전용 업데이트를 내놓았고, 샤오미는 1T 모델에서 초당 1000 토큰을 처리하는 속도를 선보였어요. 오늘은 인프라와 모델 양쪽에서 큰 움직임이 있었던 날이에요.
오늘의 헤드라인
01 items애플, 구글 제미나이 기반 새 AI 아키텍처 공개 — Siri AI도 함께, HN 288점
애플이 WWDC 2026에서 자체 AI 모델 대신 구글 제미나이(Gemini)를 핵심으로 한 새로운 AI 아키텍처를 공개했어요. 동시에 'Apple Intelligence' 브랜드 아래 Siri AI 페이지도 열렸어요. HN 288점. '애플이 드디어 AI에서 제대로 움직인다'는 반응과 '구글에 의존하는 게 맞나'는 우려가 섞여 있어요.
- 애플, 구글 제미나이 모델을 기반으로 한 AI 아키텍처 발표 — 기존 자체 모델 전략에서 선회
- MacRumors 기사(https://www.macrumors.com/2026/06/08/apple-reveals-new-ai-architecture/)와 Apple 공식 페이지(apple.com/apple-intelligence/) 동시 공개
- HN 288점 — 기술 커뮤니티의 큰 관심
- Siri AI 페이지에서는 'Apple Intelligence' 기능 설명, 제미나이 기반 추론 강조
- 다음 24시간: WWDC 키노트 상세 내용과 개발자 반응 주목
얻는 것애플의 AI 전략 변화를 이해하고, 앞으로 아이폰·맥에서 어떤 AI 기능이 나올지 예측할 수 있어요.
지금 할 일$MacRumors 기사와 Apple Intelligence 페이지를 읽고, WWDC 2026 키노트 요약을 찾아보세요.
왜 지금 — 애플이 AI에서 '밀리의 서재'에서 '구글 빌려쓰기'로 방향을 튼 건 업계 지형을 바꾸는 사건이에요. 제미나이의 영향력이 더 커지고, 애플 생태계 AI 경쟁력이 어떻게 변할지가 관건이에요.
릴리스 · 신모델
01 itemsvLLM v0.22.0 출시: DeepSeek V4 전용 패키지, NVFP4 MoE, MTP 추론 등 대규모 업데이트
vLLM이 v0.22.0을 공개했어요. 230명의 기여자가 459개 커밋을 쏟아부은 대형 릴리스입니다. DeepSeek V4 모델을 위한 전용 패키지, NVFP4 fused MoE 지원, CUDA 그래프 최적화, MTP speculative decoding 등 성능과 정확도가 크게 개선됐어요. Model Runner V2도 기본값으로 가는 중입니다.
- DeepSeek V4 전용 패키지 신설: 모델 구조를 `vllm/models/deepseek_v4/`로 재구성, 유지보수와 확장성 대폭 개선
- NVFP4 fused MoE 지원 추가: 4비트 부동소수점으로 MoE 레이어를 효율적으로 처리, 메모리 사용량 감소
- MTP speculative decoding 도입: Multi-Token Prediction으로 추론 속도 향상
- CUDA 그래프 전체/부분 지원: DeepSeek V4에서 CUDA 그래프를 활용해 실행 시간 단축
- 63명의 신규 기여자 포함: 오픈소스 생태계 확장 중
얻는 것DeepSeek V4를 vLLM으로 돌리고 있다면, 업그레이드만으로 추론 속도와 메모리 효율이 개선돼요. 새 패키지 구조 덕분에 커스텀 모델 추가도 쉬워졌어요.
지금 할 일$pip install vllm --upgrade 로 업데이트하고, DeepSeek V4 사용자는 설정 파일을 새 패키지 경로에 맞게 수정해보세요.
왜 지금 — vLLM은 LLM 서빙의 사실상 표준입니다. 이번 업데이트는 DeepSeek V4 같은 최신 모델을 더 빠르고 효율적으로 서비스할 수 있게 해줘요. 특히 NVFP4와 MTP는 실제 운영 환경에서 비용 절감으로 직결됩니다.
핫 레포
03 itemsClaude Code 완벽 가이드 'claude-howto', 3만 5741 스타 — 오늘 +393스타
Claude Code를 처음부터 고급 에이전트까지 배울 수 있는 시각적 가이드 'claude-howto'가 깃허브에서 폭발적 인기예요. 총 3만 5741 스타, 오늘 하루 393스타 추가. 복사해서 바로 쓸 수 있는 템플릿까지 포함돼 있어 Claude Code 입문자에게 딱이에요.
- Claude Code 학습을 위한 시각적 예제 중심 가이드
- 총 3만 5741 스타, 오늘 +393스타
- 기본 개념부터 고급 에이전트까지 단계별 구성
- 복사-붙여넣기 가능한 템플릿 제공으로 즉시 활용 가능
- Python 예제 위주, Claude Code CLI 사용법 포함
얻는 것Claude Code로 할 수 있는 거의 모든 작업을 예제로 배울 수 있어요. 파일 편집, 에이전트 루프, MCP 도구 연동 등 실무 패턴을 바로 따라해볼 수 있어요.
지금 할 일$레포 README에 있는 'Quick Start' 예제를 터미널에 붙여넣고 실행해보세요. Claude Code가 설치되어 있어야 해요.
왜 지금 — Claude Code가 점점 더 많이 쓰이는데, 공식 문서만으로는 부족했던 실전 예제를 이 레포가 채워주고 있어요. 3만 5천 스타는 그 수요를 증명하죠.
구글, 자사 제품용 AI 에이전트 스킬 모음 'google/skills' 공개 — 오늘 +481스타
구글이 자사 제품(지메일, 캘린더, 드라이브 등)을 AI 에이전트가 제어할 수 있는 스킬 모음을 깃허브에 공개했어요. 파이썬 기반, 1만 2357 스타, 오늘 하루 481스타 추가. 구글 생태계에서 에이전트를 돌려보고 싶다면 바로 확인해볼 만해요.
- 구글이 자사 제품용 에이전트 스킬 모음 공개
- 언어: Python, 총 1만 2357 스타, 오늘 +481스타
- 지메일, 캘린더, 드라이브 등 구글 제품 제어 가능
- 기존 구글 API를 에이전트 친화적으로 래핑한 듯
- README에서 예제부터 따라해보면 바로 써볼 수 있어요
얻는 것구글 제품을 AI 에이전트로 자동화하는 방법을 배울 수 있어요. 예: '지메일에서 오늘 회의 요약 보내줘' 같은 명령을 직접 만들어볼 수 있어요.
지금 할 일$README에서 'Getting Started' 섹션부터 따라해보세요. pip install로 바로 시작 가능해요.
왜 지금 — 구글이 공식적으로 에이전트 스킬을 제공한다는 점이 중요해요. 그동안 서드파티 도구에 의존했던 구글 생태계 에이전트 개발이 훨씬 쉬워질 거예요.
PM 스킬 마켓플레이스 'pm-skills', 1만 2619 스타 — 에이전트로 프로젝트 관리 자동화
프로젝트 매니저를 위한 AI 에이전트 스킬 모음 'pm-skills'가 깃허브에서 주목받고 있어요. 100개 이상의 에이전트 스킬, 명령어, 플러그인을 제공하며, 기획부터 실행, 출시, 성장까지 전 과정을 커버해요. 오늘 +112스타, 총 1만 2619 스타.
- PM 업무를 AI 에이전트로 자동화하는 스킬 모음
- 100개 이상의 스킬, 명령어, 플러그인 포함
- 기획, 전략, 실행, 출시, 성장 단계별 구성
- 오늘 +112스타, 총 1만 2619 스타
- 언어 혼합, Claude Code나 Codex와 함께 사용 가능
얻는 것프로젝트 관리에서 자주 하는 작업(회의록 작성, 일정 관리, 리스크 추적 등)을 AI 에이전트에게 시키는 방법을 배울 수 있어요.
지금 할 일$레포에서 'Discovery' 섹션을 먼저 살펴보고, 자신의 PM 업무에 맞는 스킬을 찾아보세요.
왜 지금 — PM 업무는 반복적인 문서 작업이 많은데, 이걸 에이전트로 자동화하면 생산성이 크게 올라가요. 실제로 많은 PM이 관심을 가지는 분야예요.
정부 지원사업
02 items경기도, 글로벌 유니콘 캠퍼스 과정 참여기업 모집 (~6/25)
경기도경제과학진흥원이 기술분야 7년 이내 창업기업 대상 글로벌 유니콘 캠퍼스 과정 참여기업을 모집해요. 투자 유치 실적이 있는 기업에 한하며, 멘토링·컨설팅·교육을 지원합니다. 접수는 6월 25일까지.
- 경기도경제과학진흥원 주관, 글로벌 시장 진출 희망 기술 스타트업 대상
- 지원 대상: 7년 이내 창업기업 (신산업 10년 이내), 최근 3년 내 1천만원 이상 투자 유치 실적 필수
- 접수 기간: 6월 9일 ~ 6월 25일 (D-16)
- 핵심 지원: 멘토링·컨설팅·교육 중심의 역량 강화 프로그램
- 신청: K-Startup 홈페이지에서 온라인 접수
얻는 것글로벌 시장 진출을 위한 맞춤형 멘토링과 네트워킹, 유니콘 기업으로 성장하는 데 필요한 역량 강화 프로그램을 받을 수 있어요.
지금 할 일$K-Startup 홈페이지에서 공고 확인 후 온라인 접수하세요. 투자 유치 실적 증빙 자료 준비 필수.
왜 지금 — 경기도가 글로벌 유니콘 육성에 직접 나서는 프로그램이에요. AI·SW 스타트업이라면 투자 실적만 갖추면 지원 가능해서, 해외 진출을 꿈꾸는 팀에 좋은 기회예요.
관악S밸리, 데모데이 및 투자자 매칭데이 참여 스타트업 모집 (~6/26)
관악중소벤처진흥원이 초기 스타트업 대상 데모데이(S-Launch Track) 및 투자자 매칭데이 참여기업을 모집해요. Seed 이하 투자 라운드 기업 대상, 전국 어디서나 지원 가능. 접수는 6월 26일까지.
- 관악중소벤처진흥원 주관, 초기 스타트업 투자 유치 지원 행사
- 지원 대상: Seed 이하 투자 라운드 스타트업 (예비창업자 포함 10년 미만)
- 접수 기간: 6월 10일 ~ 6월 26일 (D-17)
- 핵심 내용: 데모데이 발표 기회 + 맞춤형 투자자 매칭
- 신청: K-Startup 통해 온라인 접수
얻는 것데모데이에서 피칭하고, 투자자와 1:1 매칭 미팅을 가질 수 있어요. 네트워킹과 함께 실제 투자 유치 가능성.
지금 할 일$K-Startup에서 공고 확인 후 신청서와 IR 자료 준비해서 접수하세요.
왜 지금 — 초기 스타트업이 투자자와 직접 연결될 수 있는 기회예요. AI·SW 스타트업이라면 시드 투자 유치를 노려볼 만한 자리.
주목할 페이퍼
01 itemsVLM이 '보는 능력' 부족해서 틀리는 거였어요 — 인식과 추론 분리 학습법
최신 VLM(비전-언어 모델)들이 긴 추론 사슬을 강조하지만, 실제 성능 저하는 '추론'이 아니라 '시각 인식' 부족 때문이라는 연구 결과가 나왔어요. 연구팀은 VLM의 능력을 시각 인식, 시각 추론, 텍스트 추론 세 단계로 분해하고 각각에 맞춘 데이터로 학습하는 방식을 제안했어요. 이 방법으로 기존 모델의 시각적 과제 성능을 크게 개선할 수 있었다고 해요.
- VLM 성능 병목은 추론이 아니라 시각 인식(perception) 부족 때문이라는 걸 실험으로 증명
- 시각 인식, 시각 추론, 텍스트 추론 세 단계로 분해해 각각 전용 데이터로 학습하는 파이프라인 제안
- 시각 인식 단계 최적화가 전체 성능에 가장 큰 영향, 기존 CoT 중심 접근의 한계 지적
- 이 연구는 VLM 포스트트레이닝 전략에 방향 제시 — 더 많은 추론 데이터보다 더 나은 시각 데이터가 필요
- 실제 VLM 사용 시 '추론 실패'와 '인식 실패'를 구분하는 진단 기준 제공
얻는 것VLM을 파인튜닝하거나 프롬프트 엔지니어링할 때, 시각 인식 능력을 먼저 확인해야 한다는 인사이트를 얻을 수 있어요. 또한 모델이 틀렸을 때 '추론 실패'인지 '인식 실패'인지 진단하는 기준을 알게 돼요.
지금 할 일$자신이 쓰는 VLM에 시각적 세부 사항을 정확히 인식하는지 테스트해보세요. 예를 들어 '이미지에 있는 글자를 모두 읽어줘' 같은 간단한 질문으로 인식 능력을 먼저 체크해보는 거예요.
왜 지금 — VLM을 실제 서비스에 쓰는 개발자라면 '모델이 왜 이렇게 멍청한 답을 내놓지?'라는 경험을 해봤을 거예요. 이 연구는 그 원인이 추론이 아니라 시각 인식에 있다는 걸 보여줘요. 앞으로 VLM 개선 방향이 '더 긴 생각'이 아니라 '더 잘 보기'로 바뀔 수 있다는 시사점이 있어요.
커뮤니티 반응
04 items샤오미 MiMo-v2.5-Pro-UltraSpeed: 1T 모델 초당 1000 토큰 처리, HN 454점
샤오미 AI 연구소가 공개한 MiMo-v2.5-Pro-UltraSpeed 모델이 1조 파라미터 규모에서 초당 1000 토큰을 처리한다고 주장했어요. HN에서 454점을 받으며 '진짜 가능한가?' 논쟁이 뜨거워요. 벤치마크 수치만 보면 엄청나지만, 실제 환경 검증은 아직이에요.
- 1조 파라미터 모델을 초당 1000 토큰으로 추론 — 엄청난 속도 주장
- 샤오미 AI 연구소(Mimo)에서 발표, 블로그에 상세 내용 공개
- HN 454점 — 기술적 가능성에 대한 회의론과 기대가 섞임
- 기존 1T 모델 대비 5~10배 빠른 수치, 양자화나 하드웨어 최적화 의문
- 직접 확인하려면 블로그 글(https://mimo.xiaomi.com/blog/mimo-tilert-1000tps) 참고
얻는 것최신 LLM 추론 속도 기술의 최전선을 알게 돼요. 샤오미의 AI 역량을 가늠해볼 수 있어요.
지금 할 일$블로그 글을 읽고, 실제 벤치마크 조건이 무엇인지 확인해보세요.
왜 지금 — 추론 속도는 LLM 실용화의 핵심인데, 1T 모델에서 1000 tps는 기존 한계를 크게 뛰어넘는 주장이에요. 진짜라면 AI 서비스 비용이 확 낮아질 수 있어요.
Show HN: Performative-UI — 디자인 트로피 모은 React 컴포넌트 라이브러리, HN 698점
React로 만든 UI 컴포넌트 라이브러리인데, 평소 우리가 보는 '로딩 스피너', '스켈레톤 화면' 같은 디자인 클리셰를 모아놨어요. HN에서 698점을 받으며 큰 관심을 끌었어요. '이런 게 필요했어' vs '또 다른 UI 라이브러리?' 반응이 갈리고 있어요.
- React 기반 UI 컴포넌트 라이브러리로, 흔한 디자인 패턴(로딩, 스켈레톤, 토스트 등)을 모듈화
- HN 698점 — 오늘의 최고 점수
- 개발자 vorpus가 만들었고, 데모 페이지에서 바로 써볼 수 있음
- 왜 지금 뜨는가: '매번 비슷한 UI 다시 만들기 지쳤다'는 공감대
- npm install performative-ui 로 설치 가능
얻는 것흔한 UI 패턴을 바로 가져다 쓸 수 있는 컴포넌트 세트를 알게 돼요. 직접 써보고 내 프로젝트에 적용할지 판단할 수 있어요.
지금 할 일$데모 페이지(https://vorpus.github.io/performativeUI/)에서 컴포넌트를 둘러보세요.
왜 지금 — UI 라이브러리는 많지만 '디자인 트로피'라는 컨셉이 신선해요. 개발자들이 반복적으로 만드는 UI 조각을 표준화하려는 움직임으로 볼 수 있어요.
DeepSeek V4 Pro, GPT-5.5 Pro 정밀도에서 앞섰다 — HN 387점
중국 AI 스타트업 DeepSeek가 V4 Pro 모델이 OpenAI의 GPT-5.5 Pro를 정밀도 벤치마크에서 이겼다고 주장했어요. HN 387점으로 화제. 하지만 '벤치마크 선별' 논란도 함께 올라오고 있어요. 진짜 성능은 아직 독립 평가가 필요해요.
- DeepSeek V4 Pro가 특정 정밀도 벤치마크에서 GPT-5.5 Pro를 능가했다고 주장
- HN 387점 — 중국 AI 모델의 빠른 추격을 보여주는 사건
- OpenAI의 GPT-5.5 Pro는 최근 출시된 최상위 모델
- 커뮤니티 반응: '벤치마크를 골라잡은 것 같다'는 회의론 vs '중국 AI 무섭다'는 놀라움
- 원문: https://runtimewire.com/article/deepseek-v4-pro-beats-gpt-5-5-pro-on-precision
얻는 것최신 AI 모델 간 성능 비교 동향을 파악할 수 있어요. DeepSeek의 기술력을 평가하는 데 도움돼요.
지금 할 일$해당 벤치마크의 구체적인 항목과 조건을 원문에서 확인해보세요.
왜 지금 — 중국 AI 모델이 GPT 최신 버전을 특정 영역에서 앞질렀다는 주장은 AI 패권 경쟁의 중요한 신호예요. 진위 여부와 상관없이 업계 파장이 클 거예요.
'LLM이 내 커리어를 망친다' 글에 달린 댓글들 — 작성자가 직접 정리 (HN 127점)
지난주 HN 744점을 기록한 'LLM이 내 소프트웨어 엔지니어 커리어를 망치고 있어요' 글의 작성자가, 그 글에 달린 수백 개 댓글을 모아 답변을 달았어요. HN 127점. 'AI가 일자리를 대체한다'는 논란에 양측 의견을 정리한 후속 글이에요.
- 원글 'LLMs are eroding my career'의 후속 — 작성자가 댓글에 직접 답변
- HN 127점 — 원글(744점)보다는 덜하지만 여전히 활발한 토론
- 주요 논점: AI가 생산성을 높이는가 vs 일자리를 없애는가
- 작성자는 'AI로 인해 주니어 포지션이 사라지고 있다'는 입장 유지
- 전체 토론은 HN 스레드에서 읽을 수 있음
얻는 것AI와 개발자 커리어에 대한 찬반 논리를 모두 접할 수 있어요. 내立场을 정리하는 데 도움돼요.
지금 할 일$HN 스레드(https://news.ycombinator.com/item?id=?)에서 원글과 후속 댓글을 읽어보세요. (원글 ID는 active_story 참고)
왜 지금 — AI가 소프트웨어 엔지니어링 직업에 미치는 영향에 대한 가장 뜨거운 논쟁의 연장이에요. 개발자라면 누구나 고민하는 주제를 다양한 시각으로 볼 수 있어요.
애플의 제미나이 채택이 구글과의 관계를 어떻게 바꿀지, 그리고 샤오미의 속도 주장이 실제 서비스에서 증명될지가 앞으로의 관전 포인트예요.
단톡방에 공유
카카오톡 공유 버튼 한 번 누르면 단톡방 여러 개에 카드 형태로 한 번에 보낼 수 있어요. 텍스트 붙여넣기로 보내고 싶으면 펼치기 눌러서 전체 텍스트 복사.