Mrbaeksang
접속·오늘

№ 049 · · 매일 08:00 KST

049 · 2026-06-09

049

애플이 AI 전략을 대대적으로 수정했어요. 구글 제미나이를 기반으로 한 새 아키텍처를 공개하면서 Siri도 함께 개편한다고 하네요. 한편 vLLM이 DeepSeek V4 전용 업데이트를 내놓았고, 샤오미는 1T 모델에서 초당 1000 토큰을 처리하는 속도를 선보였어요. 오늘은 인프라와 모델 양쪽에서 큰 움직임이 있었던 날이에요.

오늘의 헤드라인

01 items
  • 애플, 구글 제미나이 기반 새 AI 아키텍처 공개 — Siri AI도 함께, HN 288점

    애플이 WWDC 2026에서 자체 AI 모델 대신 구글 제미나이(Gemini)를 핵심으로 한 새로운 AI 아키텍처를 공개했어요. 동시에 'Apple Intelligence' 브랜드 아래 Siri AI 페이지도 열렸어요. HN 288점. '애플이 드디어 AI에서 제대로 움직인다'는 반응과 '구글에 의존하는 게 맞나'는 우려가 섞여 있어요.

    • 애플, 구글 제미나이 모델을 기반으로 한 AI 아키텍처 발표 — 기존 자체 모델 전략에서 선회
    • MacRumors 기사(https://www.macrumors.com/2026/06/08/apple-reveals-new-ai-architecture/)와 Apple 공식 페이지(apple.com/apple-intelligence/) 동시 공개
    • HN 288점 — 기술 커뮤니티의 큰 관심
    • Siri AI 페이지에서는 'Apple Intelligence' 기능 설명, 제미나이 기반 추론 강조
    • 다음 24시간: WWDC 키노트 상세 내용과 개발자 반응 주목
    얻는 것

    애플의 AI 전략 변화를 이해하고, 앞으로 아이폰·맥에서 어떤 AI 기능이 나올지 예측할 수 있어요.

    지금 할 일

    $MacRumors 기사와 Apple Intelligence 페이지를 읽고, WWDC 2026 키노트 요약을 찾아보세요.

    왜 지금애플이 AI에서 '밀리의 서재'에서 '구글 빌려쓰기'로 방향을 튼 건 업계 지형을 바꾸는 사건이에요. 제미나이의 영향력이 더 커지고, 애플 생태계 AI 경쟁력이 어떻게 변할지가 관건이에요.

    hn-algolia9/10스토리

릴리스 · 신모델

01 items
  • vLLM v0.22.0 출시: DeepSeek V4 전용 패키지, NVFP4 MoE, MTP 추론 등 대규모 업데이트

    vLLM이 v0.22.0을 공개했어요. 230명의 기여자가 459개 커밋을 쏟아부은 대형 릴리스입니다. DeepSeek V4 모델을 위한 전용 패키지, NVFP4 fused MoE 지원, CUDA 그래프 최적화, MTP speculative decoding 등 성능과 정확도가 크게 개선됐어요. Model Runner V2도 기본값으로 가는 중입니다.

    • DeepSeek V4 전용 패키지 신설: 모델 구조를 `vllm/models/deepseek_v4/`로 재구성, 유지보수와 확장성 대폭 개선
    • NVFP4 fused MoE 지원 추가: 4비트 부동소수점으로 MoE 레이어를 효율적으로 처리, 메모리 사용량 감소
    • MTP speculative decoding 도입: Multi-Token Prediction으로 추론 속도 향상
    • CUDA 그래프 전체/부분 지원: DeepSeek V4에서 CUDA 그래프를 활용해 실행 시간 단축
    • 63명의 신규 기여자 포함: 오픈소스 생태계 확장 중
    얻는 것

    DeepSeek V4를 vLLM으로 돌리고 있다면, 업그레이드만으로 추론 속도와 메모리 효율이 개선돼요. 새 패키지 구조 덕분에 커스텀 모델 추가도 쉬워졌어요.

    지금 할 일

    $pip install vllm --upgrade 로 업데이트하고, DeepSeek V4 사용자는 설정 파일을 새 패키지 경로에 맞게 수정해보세요.

    왜 지금vLLM은 LLM 서빙의 사실상 표준입니다. 이번 업데이트는 DeepSeek V4 같은 최신 모델을 더 빠르고 효율적으로 서비스할 수 있게 해줘요. 특히 NVFP4와 MTP는 실제 운영 환경에서 비용 절감으로 직결됩니다.

    github-releases8/10스토리

핫 레포

03 items
  • Claude Code 완벽 가이드 'claude-howto', 3만 5741 스타 — 오늘 +393스타

    Claude Code를 처음부터 고급 에이전트까지 배울 수 있는 시각적 가이드 'claude-howto'가 깃허브에서 폭발적 인기예요. 총 3만 5741 스타, 오늘 하루 393스타 추가. 복사해서 바로 쓸 수 있는 템플릿까지 포함돼 있어 Claude Code 입문자에게 딱이에요.

    • Claude Code 학습을 위한 시각적 예제 중심 가이드
    • 총 3만 5741 스타, 오늘 +393스타
    • 기본 개념부터 고급 에이전트까지 단계별 구성
    • 복사-붙여넣기 가능한 템플릿 제공으로 즉시 활용 가능
    • Python 예제 위주, Claude Code CLI 사용법 포함
    얻는 것

    Claude Code로 할 수 있는 거의 모든 작업을 예제로 배울 수 있어요. 파일 편집, 에이전트 루프, MCP 도구 연동 등 실무 패턴을 바로 따라해볼 수 있어요.

    지금 할 일

    $레포 README에 있는 'Quick Start' 예제를 터미널에 붙여넣고 실행해보세요. Claude Code가 설치되어 있어야 해요.

    왜 지금Claude Code가 점점 더 많이 쓰이는데, 공식 문서만으로는 부족했던 실전 예제를 이 레포가 채워주고 있어요. 3만 5천 스타는 그 수요를 증명하죠.

    github-trending8/10스토리
  • 구글, 자사 제품용 AI 에이전트 스킬 모음 'google/skills' 공개 — 오늘 +481스타

    구글이 자사 제품(지메일, 캘린더, 드라이브 등)을 AI 에이전트가 제어할 수 있는 스킬 모음을 깃허브에 공개했어요. 파이썬 기반, 1만 2357 스타, 오늘 하루 481스타 추가. 구글 생태계에서 에이전트를 돌려보고 싶다면 바로 확인해볼 만해요.

    • 구글이 자사 제품용 에이전트 스킬 모음 공개
    • 언어: Python, 총 1만 2357 스타, 오늘 +481스타
    • 지메일, 캘린더, 드라이브 등 구글 제품 제어 가능
    • 기존 구글 API를 에이전트 친화적으로 래핑한 듯
    • README에서 예제부터 따라해보면 바로 써볼 수 있어요
    얻는 것

    구글 제품을 AI 에이전트로 자동화하는 방법을 배울 수 있어요. 예: '지메일에서 오늘 회의 요약 보내줘' 같은 명령을 직접 만들어볼 수 있어요.

    지금 할 일

    $README에서 'Getting Started' 섹션부터 따라해보세요. pip install로 바로 시작 가능해요.

    왜 지금구글이 공식적으로 에이전트 스킬을 제공한다는 점이 중요해요. 그동안 서드파티 도구에 의존했던 구글 생태계 에이전트 개발이 훨씬 쉬워질 거예요.

    github-trending7/10스토리
  • PM 스킬 마켓플레이스 'pm-skills', 1만 2619 스타 — 에이전트로 프로젝트 관리 자동화

    프로젝트 매니저를 위한 AI 에이전트 스킬 모음 'pm-skills'가 깃허브에서 주목받고 있어요. 100개 이상의 에이전트 스킬, 명령어, 플러그인을 제공하며, 기획부터 실행, 출시, 성장까지 전 과정을 커버해요. 오늘 +112스타, 총 1만 2619 스타.

    • PM 업무를 AI 에이전트로 자동화하는 스킬 모음
    • 100개 이상의 스킬, 명령어, 플러그인 포함
    • 기획, 전략, 실행, 출시, 성장 단계별 구성
    • 오늘 +112스타, 총 1만 2619 스타
    • 언어 혼합, Claude Code나 Codex와 함께 사용 가능
    얻는 것

    프로젝트 관리에서 자주 하는 작업(회의록 작성, 일정 관리, 리스크 추적 등)을 AI 에이전트에게 시키는 방법을 배울 수 있어요.

    지금 할 일

    $레포에서 'Discovery' 섹션을 먼저 살펴보고, 자신의 PM 업무에 맞는 스킬을 찾아보세요.

    왜 지금PM 업무는 반복적인 문서 작업이 많은데, 이걸 에이전트로 자동화하면 생산성이 크게 올라가요. 실제로 많은 PM이 관심을 가지는 분야예요.

    github-trending6/10스토리

정부 지원사업

02 items
  • 경기도, 글로벌 유니콘 캠퍼스 과정 참여기업 모집 (~6/25)

    경기도경제과학진흥원이 기술분야 7년 이내 창업기업 대상 글로벌 유니콘 캠퍼스 과정 참여기업을 모집해요. 투자 유치 실적이 있는 기업에 한하며, 멘토링·컨설팅·교육을 지원합니다. 접수는 6월 25일까지.

    • 경기도경제과학진흥원 주관, 글로벌 시장 진출 희망 기술 스타트업 대상
    • 지원 대상: 7년 이내 창업기업 (신산업 10년 이내), 최근 3년 내 1천만원 이상 투자 유치 실적 필수
    • 접수 기간: 6월 9일 ~ 6월 25일 (D-16)
    • 핵심 지원: 멘토링·컨설팅·교육 중심의 역량 강화 프로그램
    • 신청: K-Startup 홈페이지에서 온라인 접수
    얻는 것

    글로벌 시장 진출을 위한 맞춤형 멘토링과 네트워킹, 유니콘 기업으로 성장하는 데 필요한 역량 강화 프로그램을 받을 수 있어요.

    지금 할 일

    $K-Startup 홈페이지에서 공고 확인 후 온라인 접수하세요. 투자 유치 실적 증빙 자료 준비 필수.

    왜 지금경기도가 글로벌 유니콘 육성에 직접 나서는 프로그램이에요. AI·SW 스타트업이라면 투자 실적만 갖추면 지원 가능해서, 해외 진출을 꿈꾸는 팀에 좋은 기회예요.

    k-startup6/10스토리
  • 관악S밸리, 데모데이 및 투자자 매칭데이 참여 스타트업 모집 (~6/26)

    관악중소벤처진흥원이 초기 스타트업 대상 데모데이(S-Launch Track) 및 투자자 매칭데이 참여기업을 모집해요. Seed 이하 투자 라운드 기업 대상, 전국 어디서나 지원 가능. 접수는 6월 26일까지.

    • 관악중소벤처진흥원 주관, 초기 스타트업 투자 유치 지원 행사
    • 지원 대상: Seed 이하 투자 라운드 스타트업 (예비창업자 포함 10년 미만)
    • 접수 기간: 6월 10일 ~ 6월 26일 (D-17)
    • 핵심 내용: 데모데이 발표 기회 + 맞춤형 투자자 매칭
    • 신청: K-Startup 통해 온라인 접수
    얻는 것

    데모데이에서 피칭하고, 투자자와 1:1 매칭 미팅을 가질 수 있어요. 네트워킹과 함께 실제 투자 유치 가능성.

    지금 할 일

    $K-Startup에서 공고 확인 후 신청서와 IR 자료 준비해서 접수하세요.

    왜 지금초기 스타트업이 투자자와 직접 연결될 수 있는 기회예요. AI·SW 스타트업이라면 시드 투자 유치를 노려볼 만한 자리.

    k-startup5/10스토리

주목할 페이퍼

01 items
  • VLM이 '보는 능력' 부족해서 틀리는 거였어요 — 인식과 추론 분리 학습법

    최신 VLM(비전-언어 모델)들이 긴 추론 사슬을 강조하지만, 실제 성능 저하는 '추론'이 아니라 '시각 인식' 부족 때문이라는 연구 결과가 나왔어요. 연구팀은 VLM의 능력을 시각 인식, 시각 추론, 텍스트 추론 세 단계로 분해하고 각각에 맞춘 데이터로 학습하는 방식을 제안했어요. 이 방법으로 기존 모델의 시각적 과제 성능을 크게 개선할 수 있었다고 해요.

    • VLM 성능 병목은 추론이 아니라 시각 인식(perception) 부족 때문이라는 걸 실험으로 증명
    • 시각 인식, 시각 추론, 텍스트 추론 세 단계로 분해해 각각 전용 데이터로 학습하는 파이프라인 제안
    • 시각 인식 단계 최적화가 전체 성능에 가장 큰 영향, 기존 CoT 중심 접근의 한계 지적
    • 이 연구는 VLM 포스트트레이닝 전략에 방향 제시 — 더 많은 추론 데이터보다 더 나은 시각 데이터가 필요
    • 실제 VLM 사용 시 '추론 실패'와 '인식 실패'를 구분하는 진단 기준 제공
    얻는 것

    VLM을 파인튜닝하거나 프롬프트 엔지니어링할 때, 시각 인식 능력을 먼저 확인해야 한다는 인사이트를 얻을 수 있어요. 또한 모델이 틀렸을 때 '추론 실패'인지 '인식 실패'인지 진단하는 기준을 알게 돼요.

    지금 할 일

    $자신이 쓰는 VLM에 시각적 세부 사항을 정확히 인식하는지 테스트해보세요. 예를 들어 '이미지에 있는 글자를 모두 읽어줘' 같은 간단한 질문으로 인식 능력을 먼저 체크해보는 거예요.

    왜 지금VLM을 실제 서비스에 쓰는 개발자라면 '모델이 왜 이렇게 멍청한 답을 내놓지?'라는 경험을 해봤을 거예요. 이 연구는 그 원인이 추론이 아니라 시각 인식에 있다는 걸 보여줘요. 앞으로 VLM 개선 방향이 '더 긴 생각'이 아니라 '더 잘 보기'로 바뀔 수 있다는 시사점이 있어요.

    arxiv7/10스토리

커뮤니티 반응

04 items
  • 샤오미 MiMo-v2.5-Pro-UltraSpeed: 1T 모델 초당 1000 토큰 처리, HN 454점

    샤오미 AI 연구소가 공개한 MiMo-v2.5-Pro-UltraSpeed 모델이 1조 파라미터 규모에서 초당 1000 토큰을 처리한다고 주장했어요. HN에서 454점을 받으며 '진짜 가능한가?' 논쟁이 뜨거워요. 벤치마크 수치만 보면 엄청나지만, 실제 환경 검증은 아직이에요.

    • 1조 파라미터 모델을 초당 1000 토큰으로 추론 — 엄청난 속도 주장
    • 샤오미 AI 연구소(Mimo)에서 발표, 블로그에 상세 내용 공개
    • HN 454점 — 기술적 가능성에 대한 회의론과 기대가 섞임
    • 기존 1T 모델 대비 5~10배 빠른 수치, 양자화나 하드웨어 최적화 의문
    • 직접 확인하려면 블로그 글(https://mimo.xiaomi.com/blog/mimo-tilert-1000tps) 참고
    얻는 것

    최신 LLM 추론 속도 기술의 최전선을 알게 돼요. 샤오미의 AI 역량을 가늠해볼 수 있어요.

    지금 할 일

    $블로그 글을 읽고, 실제 벤치마크 조건이 무엇인지 확인해보세요.

    왜 지금추론 속도는 LLM 실용화의 핵심인데, 1T 모델에서 1000 tps는 기존 한계를 크게 뛰어넘는 주장이에요. 진짜라면 AI 서비스 비용이 확 낮아질 수 있어요.

    hn-algolia8/10스토리
  • Show HN: Performative-UI — 디자인 트로피 모은 React 컴포넌트 라이브러리, HN 698점

    React로 만든 UI 컴포넌트 라이브러리인데, 평소 우리가 보는 '로딩 스피너', '스켈레톤 화면' 같은 디자인 클리셰를 모아놨어요. HN에서 698점을 받으며 큰 관심을 끌었어요. '이런 게 필요했어' vs '또 다른 UI 라이브러리?' 반응이 갈리고 있어요.

    • React 기반 UI 컴포넌트 라이브러리로, 흔한 디자인 패턴(로딩, 스켈레톤, 토스트 등)을 모듈화
    • HN 698점 — 오늘의 최고 점수
    • 개발자 vorpus가 만들었고, 데모 페이지에서 바로 써볼 수 있음
    • 왜 지금 뜨는가: '매번 비슷한 UI 다시 만들기 지쳤다'는 공감대
    • npm install performative-ui 로 설치 가능
    얻는 것

    흔한 UI 패턴을 바로 가져다 쓸 수 있는 컴포넌트 세트를 알게 돼요. 직접 써보고 내 프로젝트에 적용할지 판단할 수 있어요.

    지금 할 일

    $데모 페이지(https://vorpus.github.io/performativeUI/)에서 컴포넌트를 둘러보세요.

    왜 지금UI 라이브러리는 많지만 '디자인 트로피'라는 컨셉이 신선해요. 개발자들이 반복적으로 만드는 UI 조각을 표준화하려는 움직임으로 볼 수 있어요.

    hn-algolia7/10스토리
  • DeepSeek V4 Pro, GPT-5.5 Pro 정밀도에서 앞섰다 — HN 387점

    중국 AI 스타트업 DeepSeek가 V4 Pro 모델이 OpenAI의 GPT-5.5 Pro를 정밀도 벤치마크에서 이겼다고 주장했어요. HN 387점으로 화제. 하지만 '벤치마크 선별' 논란도 함께 올라오고 있어요. 진짜 성능은 아직 독립 평가가 필요해요.

    • DeepSeek V4 Pro가 특정 정밀도 벤치마크에서 GPT-5.5 Pro를 능가했다고 주장
    • HN 387점 — 중국 AI 모델의 빠른 추격을 보여주는 사건
    • OpenAI의 GPT-5.5 Pro는 최근 출시된 최상위 모델
    • 커뮤니티 반응: '벤치마크를 골라잡은 것 같다'는 회의론 vs '중국 AI 무섭다'는 놀라움
    • 원문: https://runtimewire.com/article/deepseek-v4-pro-beats-gpt-5-5-pro-on-precision
    얻는 것

    최신 AI 모델 간 성능 비교 동향을 파악할 수 있어요. DeepSeek의 기술력을 평가하는 데 도움돼요.

    지금 할 일

    $해당 벤치마크의 구체적인 항목과 조건을 원문에서 확인해보세요.

    왜 지금중국 AI 모델이 GPT 최신 버전을 특정 영역에서 앞질렀다는 주장은 AI 패권 경쟁의 중요한 신호예요. 진위 여부와 상관없이 업계 파장이 클 거예요.

    hn-algolia7/10스토리
  • 'LLM이 내 커리어를 망친다' 글에 달린 댓글들 — 작성자가 직접 정리 (HN 127점)

    지난주 HN 744점을 기록한 'LLM이 내 소프트웨어 엔지니어 커리어를 망치고 있어요' 글의 작성자가, 그 글에 달린 수백 개 댓글을 모아 답변을 달았어요. HN 127점. 'AI가 일자리를 대체한다'는 논란에 양측 의견을 정리한 후속 글이에요.

    • 원글 'LLMs are eroding my career'의 후속 — 작성자가 댓글에 직접 답변
    • HN 127점 — 원글(744점)보다는 덜하지만 여전히 활발한 토론
    • 주요 논점: AI가 생산성을 높이는가 vs 일자리를 없애는가
    • 작성자는 'AI로 인해 주니어 포지션이 사라지고 있다'는 입장 유지
    • 전체 토론은 HN 스레드에서 읽을 수 있음
    얻는 것

    AI와 개발자 커리어에 대한 찬반 논리를 모두 접할 수 있어요. 내立场을 정리하는 데 도움돼요.

    지금 할 일

    $HN 스레드(https://news.ycombinator.com/item?id=?)에서 원글과 후속 댓글을 읽어보세요. (원글 ID는 active_story 참고)

    왜 지금AI가 소프트웨어 엔지니어링 직업에 미치는 영향에 대한 가장 뜨거운 논쟁의 연장이에요. 개발자라면 누구나 고민하는 주제를 다양한 시각으로 볼 수 있어요.

    hn-algolia6/10스토리

애플의 제미나이 채택이 구글과의 관계를 어떻게 바꿀지, 그리고 샤오미의 속도 주장이 실제 서비스에서 증명될지가 앞으로의 관전 포인트예요.

단톡방에 공유

카카오톡 공유 버튼 한 번 누르면 단톡방 여러 개에 카드 형태로 한 번에 보낼 수 있어요. 텍스트 붙여넣기로 보내고 싶으면 펼치기 눌러서 전체 텍스트 복사.