№ 040 · 2026-05-31
№ 040
오늘 뉴스레터는 앤트로픽이 OpenAI를 제치고 가장 가치 있는 AI 스타트업으로 떠올랐다는 소식으로 시작하네요. AI 분야의 경쟁이 정말 치열해지고 있다는 걸 실감하게 되는데요. 한편, llama.cpp의 꾸준한 업데이트와 흥미로운 연구 논문들도 눈에 띕니다.
오늘의 헤드라인
01 items앤트로픽, OpenAI 제치고 가장 가치 있는 AI 스타트업 등극
AI 스타트업 앤트로픽이 OpenAI를 제치고 500억 달러(약 68조 원) 이상의 기업 가치를 인정받으며 가장 가치 있는 AI 기업으로 떠올랐습니다. 이는 앤트로픽의 최신 투자 라운드에서 나온 평가로, AI 분야의 치열한 경쟁과 빠른 성장을 보여줍니다.
- 앤트로픽, 500억 달러 이상 기업 가치로 AI 스타트업 1위 등극.
- OpenAI를 제치고 최고 가치 평가, AI 시장 경쟁 심화 시사.
- 최근 투자 라운드에서 나온 평가이며, 구체적인 투자자는 공개되지 않음.
- AI 분야의 폭발적인 성장과 함께 스타트업들의 가치 경쟁이 가속화.
얻는 것AI 스타트업 생태계의 최신 동향과 주요 플레이어들의 경쟁 구도를 파악할 수 있습니다.
지금 할 일$앤트로픽의 최신 모델과 기술 동향을 살펴보세요.
왜 지금 — AI 분야의 옥석 가리기가 본격화되고 있습니다. 앤트로픽의 이번 평가는 단순히 기업 가치 순위를 넘어, AI 기술 발전의 방향성과 경쟁 구도에 대한 중요한 시사점을 던집니다. 누가 미래 AI를 주도할지 주목해야 할 시점입니다.
릴리스 · 신모델
03 itemsllama.cpp, 멀티 GPU SYCL 백엔드 메모리 누수 해결한 b9145 출시
llama.cpp가 최신 b9145 버전을 출시했습니다. 이번 업데이트는 멀티 GPU SYCL 백엔드에서 발생하는 시스템 RAM 고갈 문제를 해결하는 데 중점을 두었습니다. Level Zero 할당을 사용하여 VRAM 할당이 시스템 RAM에 미러링되는 문제를 개선하여, 대규모 모델 구동 시 메모리 부족 현상을 방지합니다.
- llama.cpp의 최신 b9145 버전이 출시되었습니다.
- 멀티 GPU SYCL 백엔드에서 발생하던 시스템 RAM 고갈 문제가 해결되었습니다.
- Level Zero 할당 방식을 도입하여 VRAM 할당이 시스템 RAM에 불필요하게 복제되는 현상을 개선했습니다.
- 이로써 대규모 모델 구동 시 메모리 부족 현상을 효과적으로 방지할 수 있게 되었습니다.
얻는 것SYCL 백엔드를 사용한다면, 이제 더 큰 모델을 메모리 부족 없이 안정적으로 구동할 수 있습니다.
지금 할 일$llama.cpp 최신 버전을 확인하고, SYCL 환경이라면 업데이트를 고려해보세요.
왜 지금 — 대규모 언어 모델을 여러 GPU에서 구동할 때 발생하는 메모리 관리 문제는 성능과 안정성에 직결됩니다. 이번 llama.cpp의 업데이트는 SYCL 백엔드를 사용하는 사용자들에게 더욱 안정적인 환경을 제공하며, 더 큰 모델을 효율적으로 실행할 수 있는 기반을 마련했습니다.
llama.cpp, SpacemiT 백엔드 위한 IME2 명령어 지원 추가한 b9150 출시
llama.cpp가 b9150 버전을 공개했습니다. 이번 업데이트는 SpacemiT 백엔드에 대한 IME2 명령어 지원을 추가한 것이 특징입니다. 이를 통해 특정 하드웨어 환경에서의 성능 최적화가 기대됩니다.
- llama.cpp의 새로운 b9150 버전이 배포되었습니다.
- SpacemiT CPU 백엔드에 대한 IME2 명령어 지원이 새롭게 추가되었습니다.
- 이는 특정 하드웨어 아키텍처에서의 연산 효율성을 높이기 위한 조치입니다.
- 해당 하드웨어를 사용하는 개발자들에게 성능 향상의 기회를 제공합니다.
얻는 것SpacemiT CPU를 사용한다면, llama.cpp에서 향상된 성능을 기대할 수 있습니다.
지금 할 일$SpacemiT CPU 사용자라면 llama.cpp 최신 버전을 확인해보세요.
왜 지금 — llama.cpp는 다양한 하드웨어에서 LLM을 효율적으로 실행하기 위한 핵심 도구입니다. SpacemiT과 같은 특정 CPU 아키텍처에 대한 최적화는 더 넓은 범위의 사용자들에게 llama.cpp의 성능을 개선할 기회를 제공합니다.
llama.cpp, Qwen3.5 모델 위한 토크나이저 지원 추가한 b9148 출시
llama.cpp가 b9148 버전을 공개하며 Qwen3.5 모델 지원을 강화했습니다. 이번 업데이트는 Qwen3.5 모델의 비되돌림(non-backtracking) 토크나이저 핸들러를 추가하고 관련 회귀 테스트를 포함합니다. 이를 통해 Qwen3.5 모델 사용자의 호환성과 안정성이 향상될 것으로 기대됩니다.
- llama.cpp의 b9148 버전이 출시되어 Qwen3.5 모델 지원이 강화되었습니다.
- Qwen3.5 모델의 비되돌림(non-backtracking) 토크나이저 핸들러가 새롭게 추가되었습니다.
- 긴 입력 처리 시 발생할 수 있는 스택 오버플로우 문제를 해결하는 회귀 테스트가 포함되었습니다.
- Qwen3.5 모델 사용자의 호환성과 안정성이 향상될 것으로 예상됩니다.
얻는 것Qwen3.5 모델을 llama.cpp에서 더 안정적이고 호환성 높게 사용할 수 있습니다.
지금 할 일$Qwen3.5 모델 사용자라면 llama.cpp 최신 버전을 확인해보세요.
왜 지금 — 다양한 LLM 모델을 지원하는 것은 llama.cpp의 핵심 강점입니다. Qwen3.5와 같은 최신 모델에 대한 지원 강화는 사용자들이 더 많은 모델을 로컬 환경에서 쉽게 실행할 수 있도록 하여 LLM 생태계 발전에 기여합니다.
핫 레포
02 items터미널 속 AI 멀티플렉서 'herdr', 이번 주 878스타 급증
Rust로 만든 'herdr'는 터미널 안에서 여러 AI 에이전트(Claude, OpenAI, 로컬 모델 등)를 동시에 띄우고 전환하며 쓸 수 있는 도구예요. tmux처럼 화면 분할도 되고, 각 에이전트끼리 대화를 넘겨주는 '멀티플렉싱' 기능이 핵심이에요. 출시 1주일도 안 돼 별 3,193개, 이번 주에만 878스타가 추가됐어요.
- 터미널 안에서 Claude·OpenAI·로컬 LLM 등 여러 AI 에이전트를 동시에 쓰고 전환할 수 있는 멀티플렉서
- Rust로 작성되어 가벼운 게 특징, tmux 같은 화면 분할로 여러 에이전트 응답을 동시에 볼 수 있음
- 한 에이전트의 컨텍스트를 다른 에이전트로 넘겨주는 '에이전트 간 채널' 기능이 독특함
- 총 3,193 스타, 이번 주 878스타 추가 — GitHub 트렌딩 Rust 부문 1위 찍음
- 설치: cargo install herdr, config 파일에 API 키만 넣으면 바로 사용 가능
얻는 것터미널에서 tmux처럼 Claude·Codex·로컬 모델을 동시에 띄우고, 에이전트끼리 맥락을 주고받는 흐름을 직접 체험할 수 있어요. 여러 AI 비서를 오가며 쓰는 번거로움이 사라져요.
지금 할 일$터미널 열고 'cargo install herdr' 실행, 공식 README 따라 config에 API 키 설정 후 'herdr' 입력.
왜 지금 — AI 코딩 도구가 많아지면서 'Claude Code, Codex, Cursor, Windsurf'를 오가며 쓰는 개발자들이 늘었는데, herdr는 이걸 터미널 하나로 통합해주는 최초의 도구예요. AI 에이전트 간 협업 흐름을 터미널 안에서 실험해보고 싶다면 딱 지금 시작할 타이밍.
LLM 처음부터 학습시키는 전 과정, 한 레포에 담겼다
FareedKhan-dev/train-llm-from-scratch는 데이터 다운로드부터 텍스트 생성까지, 진짜 '처음부터' LLM을 학습시키는 실습형 레포예요. Jupyter 노트북 기반이라 한 줄씩 따라 하며 이해할 수 있고, 작은 모델부터 시작해서 점점 키우는 구조예요. 현재 별 2,219개, 오늘만 316스타 추가되며 다시 주목받고 있어요.
- 데이터 수집·토크나이징·사전학습·파인튜닝·추론까지 LLM 학습 전 과정을 커버하는 실습 레포
- Jupyter Notebook 기반이라 코드를 실행하며 단계별로 이해할 수 있음
- 작은 규모(수백만 파라미터)부터 시작해 점진적으로 확장하는 구조, 개인 GPU 1장으로도 가능
- 오늘만 +316스타, 총 2,219 스타 — '직접 만들어보며 배우자' 트렌드 반영
- README에 '3일 완성 로드맵'이 있어 학습 계획 세우기 좋음
얻는 것LLM이 내부에서 어떻게 데이터를 받아들이고, 학습하고, 문장을 생성하는지 한 땀 한 땀 따라 하며 배울 수 있어요. 논문만 읽는 것보다 10배 빠르게 이해할 거예요.
지금 할 일$레포 클론해서 '00_Setup.ipynb'부터 열고, 데이터셋 1개만 다운로드해 학습 돌려보기.
왜 지금 — AI 모델이 점점 블랙박스화되는 요즘, '직접 만들어보며 원리를 이해하자'는 수요가 커지고 있어요. 이 레포는 그런 수요를 정확히 겨냥했고, 전 과정을 투명하게 공개해서 LLM 학습에 입문하려는 개발자에게 딱 맞아요.
정부 지원사업
01 items대덕특구, 딥테크 스타트업 위한 혁신성장 플랫폼 개설
연구개발특구진흥재단이 '2026 대덕특구 딥테크 혁신성장 플랫폼' 사업을 시작합니다. 국가전략기술 분야의 시장 선점을 목표로, 공공기술을 활용한 신속한 사업화를 지원합니다. 예비창업자부터 10년 미만 업력의 스타트업 및 중소기업, 대중견기업까지 참여 가능하며, 6월 1일부터 7월 31일까지 접수를 받습니다.
- 사업명 및 주관 기관: '2026 대덕특구 딥테크 혁신성장 플랫폼'은 연구개발특구진흥재단이 주관합니다.
- 지원 대상: 예비창업자, 10년 미만 업력의 스타트업 및 중소기업, 대중견기업의 신사업 스핀오프 사업부 등이 참여할 수 있습니다.
- 핵심 목표: 국가전략기술 분야의 시장 선점을 위해 공공기술을 활용한 신속한 사업화를 지원합니다.
- 접수 기간: 2026년 6월 1일부터 7월 31일까지 신청받습니다.
얻는 것딥테크 분야 스타트업이라면 공공기술 기반 사업화 자금 및 네트워킹 기회를 얻을 수 있습니다.
지금 할 일$관심 있는 딥테크 스타트업은 접수 기간(7월 31일 마감) 내에 사업 계획을 준비해 신청하세요.
왜 지금 — 정부의 딥테크 육성 의지가 반영된 사업으로, 국가전략기술 분야에서 국내 기업들의 경쟁력을 강화하고 신속한 사업화 생태계를 구축하는 데 기여할 것으로 보입니다.
주목할 페이퍼
03 itemsDECO: 희소 MoE, 일반 모델 성능을 엔드 디바이스에서 구현
새로운 DECO 아키텍처는 희소 Mixture-of-Experts(MoE) 모델이 기존의 밀집(dense) 트랜스포머와 동일한 파라미터 및 토큰 수로 동등한 성능을 내도록 설계되었습니다. 이는 모델 용량 확장의 효율성을 높여, 저장 공간과 메모리 접근 병목 현상을 줄여 엔드 디바이스 배포에 적합합니다.
- DECO는 희소 MoE 모델이 동일한 파라미터 및 학습 데이터로 밀집 모델과 동등한 성능을 내도록 설계된 새로운 아키텍처입니다.
- 기존 MoE의 큰 파라미터 용량으로 인한 저장 공간 및 메모리 병목 현상을 해결하여 엔드 디바이스 배포에 최적화했습니다.
- ReLU 기반 라우팅 메커니즘을 활용하여 모델의 효율성과 유연성을 동시에 높였습니다.
- 고성능, 저비용, 작은 저장 공간 요구사항을 동시에 만족시켜 모바일 및 엣지 디바이스에 적용 가능합니다.
얻는 것더 적은 자원으로도 고성능 AI 모델을 스마트폰이나 소형 기기에서 실행할 수 있는 미래를 엿볼 수 있습니다.
지금 할 일$희소 MoE 모델의 발전 방향을 살펴보며, 향후 기기 내 AI 성능 향상 가능성을 기대해 보세요.
왜 지금 — MoE 모델의 확장성은 뛰어나지만, 실제 기기 적용에는 큰 제약이 있었습니다. DECO는 이러한 제약을 극복하고 희소 모델의 효율성을 유지하면서도 최고 수준의 성능을 엔드 디바이스에서 구현할 수 있는 가능성을 제시합니다.
AI 에이전트, 스킬 관리도 동적으로: 학습 효율 높이는 새 기법 SLIM 등장
LLM 에이전트가 외부 스킬을 활용하는 방식에 대한 새로운 접근법, SLIM이 제안되었습니다. 기존의 스킬을 영구적으로 축적하거나 완전히 내재화하는 방식 대신, SLIM은 작업 및 단계에 따라 최적의 스킬 세트를 동적으로 관리하여 에이전트의 학습 효율성과 유연성을 극대화합니다.
- SLIM은 LLM 에이전트가 외부 스킬을 활용하는 방식을 혁신하는 동적 스킬 라이프사이클 관리 시스템입니다.
- 기존의 고정된 스킬 관리 방식과 달리, 작업의 맥락과 진행 단계에 따라 필요한 스킬을 능동적으로 선택하고 관리합니다.
- 이는 에이전트의 학습 효율성을 높이고, 제한된 파라미터 용량 내에서 최적의 성능을 발휘하도록 돕습니다.
- 복잡한 작업을 수행하는 AI 에이전트의 성능과 적응력을 향상시키는 데 중요한 역할을 할 것으로 기대됩니다.
얻는 것AI 에이전트가 어떻게 더 똑똑하고 유연하게 학습하는지에 대한 최신 연구 동향을 파악할 수 있습니다.
지금 할 일$AI 에이전트의 스킬 관리 방식 변화를 주시하며, 미래의 지능형 시스템 발전을 예상해 보세요.
왜 지금 — AI 에이전트가 점점 더 복잡한 작업을 수행함에 따라, 효율적인 스킬 관리는 필수적입니다. SLIM은 에이전트가 다양한 상황에 더 잘 적응하고 학습할 수 있도록 하는 새로운 방향을 제시합니다.
AI, 손글씨 방글라어 복합 문자 인식률 높인다: 확산 모델 활용
손으로 쓴 방글라어 복합 문자를 인식하는 것은 복잡한 구조와 다양한 필기체 때문에 어려운 과제였습니다. 이 연구는 '신뢰도 기반 확산 증강' 기법을 사용하여 저해상도 이미지에서도 인식률을 높이는 새로운 방법을 제시합니다. 이는 특히 데이터가 부족한 언어 인식 분야에 유용합니다.
- 이 논문은 손글씨 방글라어 복합 문자 인식의 어려움을 해결하기 위한 새로운 접근법을 제시합니다.
- '신뢰도 기반 확산 증강' 기법을 활용하여, 복잡한 문자 구조와 다양한 필기체에서도 높은 인식률을 달성합니다.
- 특히 저해상도 이미지에서도 효과적인 성능을 보여, 데이터 부족 문제를 겪는 언어 인식 연구에 기여합니다.
- 이 기법은 향후 다양한 언어 및 문자 인식 시스템 개발에 응용될 수 있습니다.
얻는 것AI가 어떻게 복잡한 시각적 패턴을 학습하고, 특히 소수 언어의 디지털화에 기여하는지 알 수 있습니다.
지금 할 일$AI 기반 문자 인식 기술의 발전이 어떻게 다양한 언어의 디지털 접근성을 높이는지 살펴보세요.
왜 지금 — AI 기술이 특정 언어의 문자 인식 정확도를 높이는 데 기여하는 사례입니다. 이는 디지털 접근성을 높이고 언어 장벽을 낮추는 데 중요한 역할을 할 수 있습니다.
개발 툴
01 items📌 To have a moral stance on AI is to be an outcast, and it sucks
devtool 섹션의 To have a moral stance on AI is to be an outcast, and it sucks 항목입니다. 자세한 내용은 원문 링크에서 확인해 주세요.
- devtool 섹션에서 자동 선정된 카드입니다 (점수: 117).
- 원문에서 자세한 내용을 직접 확인할 수 있어요.
- 편집장이 별도 큐레이션 코멘트를 달지는 못했습니다.
얻는 것원문 링크에서 devtool 관련 최신 정보를 직접 확인하실 수 있어요.
지금 할 일$원문 링크 눌러서 자세한 내용 확인해보세요.
왜 지금 — 오늘 devtool 섹션 후보 중 점수가 가장 높은 항목이에요. LLM이 픽 못해서 자동으로 채웠습니다.
커뮤니티 반응
04 itemsMCP는 죽었나? AI 개발 생태계의 새로운 논쟁
최근 AI 개발 커뮤니티에서 'MCP(Machine Code Protocol)'의 유효성에 대한 논쟁이 뜨겁습니다. 일부 개발자들은 MCP가 더 이상 최신 AI 모델 및 도구와의 통합에 적합하지 않다고 주장하며, 새로운 표준의 필요성을 제기하고 있습니다.
- AI 개발 생태계에서 'MCP'의 현재와 미래에 대한 논쟁이 불붙었습니다.
- 일부 개발자들은 MCP가 최신 AI 도구와의 통합에 한계가 있다고 지적합니다.
- 새로운 통합 프로토콜이나 표준의 필요성이 제기되며 개발자들의 의견이 분분합니다.
- 이 논쟁은 AI 개발 환경의 빠른 변화와 표준화의 중요성을 보여줍니다.
얻는 것AI 개발 시 사용되는 핵심 프로토콜의 최신 동향과 논쟁점을 파악할 수 있습니다.
지금 할 일$MCP 관련 논의를 찾아보고 여러분의 의견을 공유해보세요.
왜 지금 — MCP는 AI 모델과 외부 도구 간의 통신을 위한 중요한 규약 중 하나였습니다. 이 논쟁은 AI 개발의 복잡성을 줄이고 효율성을 높이기 위한 새로운 기술적 합의가 필요한 시점임을 시사합니다.
Show HN: Tilde.run – 에이전트 샌드박스, 파일 시스템 버전 관리 기능 제공
개발자 Martyn이 공개한 'Tilde.run'은 웹 기반의 AI 에이전트 샌드박스입니다. 이 도구는 에이전트의 실행 환경을 격리하고, 파일 시스템 변경 사항을 트랜잭션 기반으로 관리하며 버전별로 되돌릴 수 있는 기능을 제공합니다.
- Tilde.run은 웹 브라우저에서 바로 사용할 수 있는 AI 에이전트 샌드박스입니다.
- 에이전트 실행 시 파일 시스템 변경 사항을 트랜잭션으로 관리하고 버전별 복구가 가능합니다.
- 개발자는 안전한 환경에서 AI 에이전트의 동작을 실험하고 디버깅할 수 있습니다.
- 오픈소스 프로젝트로 공개되어 누구나 자유롭게 사용하고 기여할 수 있습니다.
얻는 것AI 에이전트 개발 및 테스트 시 안전하고 효율적인 환경을 구축하는 방법을 알 수 있습니다.
지금 할 일$Tilde.run 웹사이트를 방문해 AI 에이전트 샌드박스를 직접 사용해보세요.
왜 지금 — AI 에이전트 개발이 활발해지면서, 예측 불가능한 동작으로부터 시스템을 보호하고 실험의 재현성을 높이는 것이 중요해졌습니다. Tilde.run은 이러한 요구에 부응하는 실용적인 솔루션을 제시합니다.
LLM 양자화 알고리즘 'auto-round' 공개: 추론 효율 극대화
인텔이 공개한 'auto-round'는 LLM의 추론 효율을 극대화하는 고급 양자화 알고리즘입니다. 이 기술은 모델의 정확도를 최소한으로 유지하면서 메모리 사용량과 연산 속도를 크게 개선하여, 더 적은 자원으로도 LLM을 실행할 수 있게 합니다.
- 인텔이 LLM 추론 효율을 높이는 새로운 양자화 알고리즘 'auto-round'를 공개했습니다.
- 이 알고리즘은 모델의 정확도를 거의 손상시키지 않으면서 메모리 사용량을 줄입니다.
- 양자화된 모델은 더 빠른 추론 속도를 제공하여 실시간 애플리케이션에 적합합니다.
- GitHub에 코드가 공개되어 개발자들이 직접 사용하고 실험해볼 수 있습니다.
얻는 것LLM의 추론 성능을 개선하는 최신 양자화 기술의 원리와 적용 방법을 알 수 있습니다.
지금 할 일$auto-round GitHub 저장소를 방문해 알고리즘을 살펴보고 LLM에 적용해보세요.
왜 지금 — LLM의 규모가 커지면서 추론 비용과 속도가 중요한 문제가 되고 있습니다. 'auto-round'와 같은 양자화 기술은 LLM의 접근성을 높이고 다양한 환경에서의 활용을 가능하게 하는 핵심 요소입니다.
Perry: TypeScript를 LLVM으로 직접 컴파일하는 도구 등장
개발자 Perry가 공개한 'Perry'는 TypeScript 코드를 LLVM IR(중간 표현)로 직접 컴파일하는 실험적인 도구입니다. 이를 통해 JavaScript 런타임 없이도 네이티브 실행 파일을 생성할 수 있어, 성능이 중요한 애플리케이션 개발에 새로운 가능성을 열었습니다.
- Perry는 TypeScript 코드를 LLVM IR로 직접 컴파일하는 새로운 컴파일러입니다.
- JavaScript 런타임 없이 네이티브 실행 파일을 생성하여 성능을 극대화합니다.
- SWC와 LLVM 기술을 활용하여 컴파일 과정을 최적화했습니다.
- 개발자는 웹 기술로 시스템 프로그래밍이나 고성능 애플리케이션을 개발할 수 있습니다.
얻는 것TypeScript를 사용하여 JavaScript 런타임 없이 고성능 네이티브 애플리케이션을 만드는 방법을 알 수 있습니다.
지금 할 일$Perry 프로젝트의 GitHub 저장소를 방문해 TypeScript 네이티브 컴파일을 시도해보세요.
왜 지금 — TypeScript는 웹 개발의 표준으로 자리 잡았지만, 주로 브라우저나 Node.js 환경에 국한되었습니다. Perry는 TypeScript의 활용 범위를 네이티브 애플리케이션 영역으로 확장하며 개발 생태계에 새로운 지평을 열고 있습니다.
AI 스타트업 경쟁부터 기술 업데이트까지, 오늘 하루도 숨 가쁘게 달려왔네요. 내일은 또 어떤 흥미로운 AI 흐름을 발견하게 될지 벌써부터 궁금해집니다.
단톡방에 공유
카카오톡 공유 버튼 한 번 누르면 단톡방 여러 개에 카드 형태로 한 번에 보낼 수 있어요. 텍스트 붙여넣기로 보내고 싶으면 펼치기 눌러서 전체 텍스트 복사.