№ 019 · 2026-05-10
№ 019
수학자 Gowers가 ChatGPT 5.5 Pro 실제 써보고 HN에서 579점 받은 후기 봤어요? 수학 문제 풀 때 전문가 눈높이에서 어떤 수준인지 자세히 나와서 재밌네요. 오늘 에이전트 쪽 repo도 ByteDance UI-TARS-desktop이 하루에 549스타 더 받았어요.
오늘의 헤드라인
01 items수학자 Gowers의 ChatGPT 5.5 Pro 실제 써본 이야기 HN 579점
영국 수학자 Tim Gowers가 ChatGPT 5.5 Pro로 수학 문제 풀어본 경험 공유했어요. 트윗 스레드에서 모델의 실수와 놀라운 점을 자세히 풀었대요. HN에서 579점 받을 만큼 반응 뜨거웠어요.
얻는 것최신 GPT가 수학 증명에서 어디까지 해내는지 구체 사례 보면서 기대치 조절할 수 있어요.
지금 할 일$트윗 스레드 먼저 훑어보세요 https://twitter.com/wtgowers/status/2052830948685676605.
왜 지금 — GPT-5.5 Pro가 수학 같은 전문 영역에서 어떤 수준인지 실사용자 피드백 나왔어요.
릴리스 · 신모델
01 itemsllama.cpp b8964: reasoning budget 재무장 패치
DONE 상태 후 새 <think> 블록 예산 재설정했대요. Qwen3.6 같은 모델에서 여러 think 블록 처리 개선됐어요.
얻는 것로컬 모델 reasoning 태그 여러 개 쓸 때 안정돼요.
지금 할 일$릴리스 노트 확인 후 `git pull` 해보세요.
왜 지금 — llama.cpp 연속 업데이트로 로컬 추론 안정성 올라가고 있어요.
핫 레포
04 itemsByteDance UI-TARS-desktop: 멀티모달 AI 에이전트 스택 3만 1358스타 오늘 +549
최신 AI 모델과 에이전트 인프라 연결하는 오픈소스 데스크톱 앱이에요. TypeScript로, 오늘 549스타 추가되며 3만 스타 돌파했대요. 바이트댄스에서 만든 멀티모달 스택 주목받아요.
얻는 것데스크톱에서 AI 에이전트 바로 돌려보고 커스텀 해볼 수 있어요.
지금 할 일$레포 issues 탭 첫 페이지 댓글 훑어보세요.
왜 지금 — 에이전트 데스크톱 앱으로 멀티모달 쉽게 쓰는 레포 터졌어요.
Ouroboros: 프롬프트 대신 스펙으로 에이전트 OS 3,829스타 이번주 +867
에이전트용 OS로, 프롬프트 대신 명세만 주면 동작하는 오픈소스예요. Python으로 만들어 GitHub에서 이번주 867스타 폭발했대요. "Stop prompting. Start specifying." 슬로건 재밌네요.
얻는 것레포 봐서 스펙 기반 에이전트 아이디어 얻고 따라 해볼 수 있어요.
지금 할 일$GitHub README 첫 스크린샷 구경부터 하세요.
왜 지금 — 에이전트 워크플로가 OS처럼 추상화되는 새 접근 나왔어요.
SuperSplat: 3D Gaussian Splat 에디터 6,261스타 오늘 +513
Gaussian Splat으로 3D 모델 편집하는 웹 에디터예요. TypeScript로, 오늘 513스타 추가됐대요. PlayCanvas에서 만든 도구예요.
얻는 것브라우저에서 3D 스플랫 직접 만져보고 실험할 수 있어요.
지금 할 일$GitHub 첫 영상 30초만 봐도 감 잡혀요.
왜 지금 — Gaussian Splat 실시간 편집 쉬워지는 오픈소스 터졌어요.
re_gent: AI 에이전트용 Git 같은 VCS HN 88점
에이전트 작업 히스토리 추적·리와인드하는 VCS 만들었대요. "왜 이걸 삭제했어?" 같은 질문 답할 수 있게요. Show HN으로 HN 88점 받았어요.
얻는 것에이전트 프로젝트에 VCS 붙여서 디버깅 쉬워져요.
지금 할 일$GitHub 페이지 예시 스크린샷 먼저 보세요.
왜 지금 — 에이전트 워크플로에 버전 컨트롤 도입하는 시도 나왔어요.
주목할 페이퍼
01 itemsLLM이 문서 위임할 때 망가뜨린대요 arXiv HN 315점
LLM에 문서 작업 맡기면 데이터가 은근히 corrupting 된다는 논문 나왔어요. 위임 과정에서 발생하는 문제 실험으로 보여줬대요. HN 315점 반응 봐도 개발자들 공감 많아요.
얻는 것RAG나 에이전트 프로젝트할 때 문서 무결성 체크 포인트 알게 돼요.
지금 할 일$arXiv 페이지 열어서 abstract부터 읽어보세요.
왜 지금 — 에이전트가 문서 다룰 때 생기는 실수 패턴 처음 분석됐어요.
커뮤니티 반응
01 itemsClaude Code로 HTML만 쓰면 이런 효과 낸대요 HN 396점
Claude Code 써서 HTML로 복잡한 UI 프로토타입 빠르게 만드는 예시 모음 봤어요. thariqs.github.io에 데모 올라와 있고 Simon Willison도 언급했대요. HN 396점으로 개발자들 관심 끌었어요.
얻는 것Claude로 HTML 프로토타입 10분 만에 따라 해보면 UI 아이디어 테스트 쉬워져요.
지금 할 일$데모 페이지 열어서 예시 HTML 복붙부터 해보세요 https://thariqs.github.io/html-effectiveness/.
왜 지금 — AI 코딩 도구가 HTML 같은 간단 언어로도 강력한 결과 내는 사례 공유됐어요.
llama.cpp처럼 로컬 도구 업데이트가 쌓이면서 에이전트 실전 사용이 가까워지는 느낌이에요. 다음엔 Gowers 같은 피드백이 더 나올지 봐요.
단톡방에 공유
카카오톡 공유 버튼 한 번 누르면 단톡방 여러 개에 카드 형태로 한 번에 보낼 수 있어요. 텍스트 붙여넣기로 보내고 싶으면 펼치기 눌러서 전체 텍스트 복사.