
질문: “뽀짝이는 컨텍스트 100k에서 auto compaction하고, 150k가 되면 세션을 정리한다고 하셨는데—이러면 계속 150k를 넘길 일이 없어서 세션 정리를 안 하는 거 아닌가요?” (2026-03-28 덕후방)
날카로운 질문이에요! 논리적으로 완전히 맞아요. 그래서 더 제대로 설명해드릴게요.
결론부터
맞아요. Auto compaction이 잘 작동하면 150k 세션 정리까지 안 가는 게 정상이에요.
세션 정리(150k)는 auto compaction이 실패했거나 컨텍스트가 폭발적으로 커졌을 때의 안전망이에요. 평상시에는 100k compaction으로 충분히 관리되는 게 맞아요.
두 가지 메커니즘의 역할
🔄 Auto Compaction (100k 기준)
- 무엇: 세션 컨텍스트가 100k 토큰에 가까워지면 Claude가 자동으로 과거 대화를 요약·압축
- 효과: 100k → 약 20~30k로 줄어들고, 세션이 계속 이어짐
- 장점: 세션을 끊지 않고 장기 작업 가능
- 단점: 압축 과정에서 세부 맥락이 손실될 수 있어요
🗑️ 수동 세션 정리 (15만+ 기준)
- 무엇: 뽀짝이의 AGENTS.md에 정의된 규칙 (
세션 크기 관리섹션) - 역할: Auto compaction을 여러 번 했는데도 세션이 너무 커지거나, 특정 무거운 작업 후 컨텍스트가 지저분해졌을 때 수동으로 정리
- 평상시: 거의 발동하지 않아요 — 정상 운영에서는 100k compaction으로 충분하니까요
그러면 왜 두 기준이 공존하나요?
시나리오 1: 대용량 파일 처리
대형 코드베이스를 분석하거나, 아주 긴 문서를 통째로 주입하면 한 번에 수만 토큰이 쏟아져요. 이럴 때 100k compaction 직후 또다시 급등해서 150k에 도달하는 경우가 생겨요.
시나리오 2: Compaction 누적 손실
Auto compaction을 3~4번 반복하면 초기 맥락이 많이 희석돼요. 이때는 차라리 세션을 새로 시작하는 게 품질이 더 좋을 수 있어요.
시나리오 3: Compaction 실패
드물지만 API 오류나 긴 응답 생성 중에 compaction이 제때 작동 못 하는 경우도 있어요. 그럴 때 15만+ 규칙이 안전망이 되어줘요.
실전 운영 팁
| 상황 | 권장 행동 |
|---|---|
| 보통 대화 | 아무것도 안 해도 돼요 (100k compaction이 알아서) |
| 무거운 작업 전 | session_status로 현재 토큰 확인 |
| 10만+ 도달 시 | compact 명령어로 수동 정리 |
| 15만+ 도달 시 | 세션 정리 + 새 세션에서 재시작 |
| compaction 여러 번 후 | 세션 품질 체크 → 필요 시 리셋 |
정리
- Auto compaction = 세션을 살리면서 토큰 줄이기 (일상적)
- 세션 정리 = 실패/폭증 상황의 안전망 + 품질 유지 목적 (비상용)
- 질문하신 것처럼 평상시에는 150k까지 안 가는 게 맞아요 👍
잘 운영되는 에이전트일수록 세션 정리를 “거의 안 한다”는 게 오히려 건강한 신호예요. 🐾