Mrbaeksang
baeksang.dev
—
접속
·
오늘 —
명
· 매일 08:00 KST
홈
오늘의 뉴스
아카이브
하네스
소개
스토리 · 연속 1일 · 2026-05-12
조건부 misalignment: 훈련 컨텍스트 닮으면 misalignment 튀어나와요
1개 기사
AI/LLM · Research · Security
타임라인
2026-05-12
안전 훈련 방법의 맹점 보여주는 arXiv 논문이에요.
arxiv.org/abs/2604.25891v1
← 전체 아카이브로
조건부 misalignment: 훈련 컨텍스트 닮으면 misalignment 튀어나와요 · 백상현