요즘 Claude Code 모델 선택창을 열어본 적 있다면, 이런 문구를 한 번쯤 마주쳤을 겁니다.
Opus 4.7 with 1M context - Most capable for complex work
그리고 동시에 어떤 곳에서는 그냥 "Opus 4.7"이라고만 적혀 있죠. "어? 둘이 다른 모델인가?"라는 합리적인 의심이 드는 순간입니다. 결론부터 말씀드리면, 같은 모델인데 다른 상황이 펼쳐지는, 약간 미묘하고도 중요한 차이가 있습니다. 오늘은 이 부분을 토큰 단위까지 정확하게 파헤쳐 보겠습니다.
한 줄 요약
claude-opus-4-7이라는 모델 ID는 단 하나입니다. "1M"이 붙느냐 안 붙느냐는 모델의 차이가 아니라, 그 모델을 호출하는 클라이언트가 컨텍스트 윈도우(Context Window)를 어디까지 열어주느냐의 차이입니다. 즉, 같은 빵인데 어떤 가게는 통째로 주고 어떤 가게는 5분의 1만 잘라서 주는 격이라고 보시면 됩니다.
우선, Opus 4.7의 정체부터
본격적인 비교에 들어가기 전에 Opus 4.7이 어떤 모델인지 기본 스펙을 짚고 가는 게 좋겠습니다. 2026년 4월 16일에 출시된 Anthropic의 현 시점 최상위 일반 공개 모델이고, 주요 사양은 다음과 같습니다.
| 모델 ID | claude-opus-4-7 |
| 최대 입력 컨텍스트 | 1,000,000 토큰 (1M) |
| 최대 출력 토큰 | 128,000 토큰 |
| 입력 가격 | $5 / 1M 토큰 |
| 출력 가격 | $25 / 1M 토큰 |
| 이미지 최대 해상도 | 2,576px / 3.75MP |
| Effort 레벨 | low / medium / high / xhigh / max |
| 토크나이저 | 신규 토크나이저 (이전 대비 최대 +35% 토큰) |
여기서 핵심은 모델의 본래 최대 컨텍스트 윈도우가 1M 토큰이라는 점입니다. 모델 자체는 1M을 받아들일 수 있게 만들어져 있어요. 문제는 그게 항상 그대로 노출되지는 않는다는 점입니다.
"Opus 4.7"과 "Opus 4.7 1M"이 갈라지는 진짜 이유
1. 클라이언트가 윈도우를 제한할 수 있다
Claude Code에서는 Opus 4.7을 선택하면 기본적으로 1M 컨텍스트가 활성화됩니다. 모델 선택기에 아예 "Opus 4.7 with 1M context"라고 표시되죠. Max, Team, Enterprise 플랜에서는 별도 설정 없이 자동으로 1M으로 업그레이드됩니다.
반면 같은 모델을 다른 클라이언트에서 쓰면 이야기가 달라집니다. 예를 들어 GitHub Copilot CLI v1.0.31에서는 Opus 4.7을 선택할 수 있지만 컨텍스트 윈도우가 약 192K~200K 수준으로 제한되어 있다는 사례가 보고됐습니다. Claude Code VS Code 확장에서도 Max 20x 플랜 사용자가 200k에 묶여 있다는 동일한 이슈가 GitHub에 올라왔고요.
즉, 같은 claude-opus-4-7을 호출해도 클라이언트 단에서 컨텍스트 상한을 어디에 두었느냐에 따라 사용자 경험은 완전히 달라집니다.
2. API에서는 어떻게 다른가
Claude API(/v1/messages)를 직접 호출할 때는 더 단순합니다. Opus 4.7, Opus 4.6, Sonnet 4.6, 그리고 Mythos Preview는 모두 1M 토큰 컨텍스트가 정식 출시(GA) 상태로 제공되며, 별도의 베타 헤더도 필요 없습니다. 200k를 넘는 요청도 그냥 보내면 됩니다.
# 1M 컨텍스트는 그냥 그대로 사용하면 됩니다. 별도 헤더 없음.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=8192,
messages=[
{"role": "user", "content": very_long_codebase_dump} # 500k 토큰도 OK
]
)
참고로 이전 세대인 Sonnet 4.5와 Sonnet 4에서는 1M 컨텍스트가 베타였고, context-1m-2025-08-07 헤더가 필요했지만 2026년 4월 30일자로 이 베타는 폐지됐습니다. 그 모델들에서 1M을 쓰려면 이제 Sonnet 4.6이나 Opus 4.6/4.7로 마이그레이션해야 합니다.
3. Pro 플랜은 또 다르다
Claude.ai 구독 플랜 기준으로 보면, Pro 사용자는 Claude Code에서 Opus 4.7을 쓰려면 추가 사용량(extra usage)을 활성화해야 합니다. 반면 Max, Team, Enterprise 플랜은 자동으로 1M 컨텍스트가 적용됩니다. 같은 Opus 4.7이라도 플랜에 따라 접근성이 달라지는 부분이죠.
가격 측면에서의 비교: "1M 컨텍스트 프리미엄"이 있을까?
이게 의외로 사람들이 가장 많이 헷갈리는 부분입니다. 결론부터 말하면, Opus 4.7에서는 1M 컨텍스트에 대한 추가 요금이 없습니다.
Opus 4.7의 가격 구조
토큰 범위 입력 가격 출력 가격
| 0 ~ 200K 토큰 | $5 / 1M | $25 / 1M |
| 200K ~ 1M 토큰 | $5 / 1M (동일) | $25 / 1M (동일) |
900K 토큰짜리 요청도, 9K 토큰짜리 요청도 토큰당 단가는 완전히 동일합니다. Opus 4.6, Sonnet 4.6도 마찬가지로 long-context 프리미엄이 없습니다.
비교: 구형 모델은 달랐다
참고로 Sonnet 4.5와 Sonnet 4(deprecated)는 200K 초과 시 프리미엄 요금이 적용됐었습니다.
모델 200K 이하 입력 200K 초과 입력 200K 이하 출력 200K 초과 출력
| Sonnet 4.5 (구형) | $3 / 1M | $6 / 1M | $15 / 1M | $22.50 / 1M |
| Opus 4.7 | $5 / 1M | $5 / 1M | $25 / 1M | $25 / 1M |
게다가 구형의 long-context 요금은 "200K를 초과한 토큰만"이 아니라 "그 요청 전체"에 프리미엄 요율이 적용되는 방식이었습니다. 1M 컨텍스트가 표준 가격으로 들어오면서 이 부분이 깔끔하게 정리된 셈이죠.
그러면 "1M을 쓴다"는 게 실질적으로 어떤 의미인가
1M 컨텍스트가 열려 있다는 건 단순히 숫자가 크다는 것 이상의 의미가 있습니다.
첫째, 멀티 레포 코드베이스를 통째로 넣을 수 있다
MSA 구조에서 여러 레포지토리에 흩어진 서비스를 한 번에 분석할 때 가장 큰 이점이 나옵니다. 예를 들어 Spring Boot 서비스 10개로 구성된 플랫폼이라면, 각 서비스의 핵심 파일들을 함께 컨텍스트에 올려도 200K로는 빠듯하지만 1M이면 여유 있게 들어갑니다.
둘째, 컴팩션(compaction) 빈도가 확 줄어든다
Claude Code 같은 에이전트형 환경에서는 대화가 길어지면 자동으로 이전 내용을 요약해서 압축하는 "compaction"이 발생합니다. 200K 윈도우에서는 이게 자주 일어나면서 맥락이 손실되는데, 1M에서는 같은 작업을 약 5배 더 오래 끌고 갈 수 있다는 보고가 있습니다. 멀티데이 프로젝트나 장시간 에이전트 작업에서는 결정적인 차이입니다.
셋째, 이미지/PDF 처리 한도도 늘어난다
1M 컨텍스트가 활성화되면 한 번의 요청에 최대 600장의 이미지나 PDF 페이지를 보낼 수 있습니다. 200K 모델은 100장이 한계입니다. 문서 처리 워크로드에서는 이 차이가 크게 체감됩니다.
토크나이저가 바뀐 점은 따로 챙겨야 한다
이건 컨텍스트 윈도우와는 별개지만, Opus 4.7을 이야기할 때 반드시 같이 짚어야 하는 변수입니다. Opus 4.7은 이전 세대와 다른 새로운 토크나이저를 사용하며, 같은 텍스트를 최대 35% 더 많은 토큰으로 쪼갤 수 있습니다.
이게 무슨 뜻이냐면, "1M 토큰 컨텍스트"라고 해도 실제로 들어가는 텍스트의 양은 Opus 4.6의 1M보다 적을 수 있다는 겁니다. 특히 코드, JSON, 비영어권 텍스트(한국어 포함)에서 토큰 인플레이션 폭이 큰 편입니다. 같은 한국어 블로그 글이라도 4.7에서는 4.6보다 토큰을 더 먹는다는 거죠.
요금표는 그대로지만 청구서는 늘어날 수 있다는 점, 그래서 마이그레이션할 때는 본인 워크로드에서 실제 토큰 사용량을 측정해보는 게 중요합니다.
정리: 한눈에 보는 비교표
| 비교 항목 | "Opus 4.7" (200k 환경) | Opus 4.7 1M (1M 환경) |
| 모델 ID | claude-opus-4-7 | claude-opus-4-7 (동일) |
| 실효 컨텍스트 윈도우 | ~200K 토큰 | 1,000,000 토큰 |
| 입력 단가 | $5 / 1M | $5 / 1M (동일) |
| 출력 단가 | $25 / 1M | $25 / 1M (동일) |
| 이미지/PDF 한도 | 100장 | 600장 |
| 자동 컴팩션 빈도 | 자주 발생 | 약 5배 더 오래 유지 |
| 추가 요금 | 없음 | 없음 (long-context 프리미엄 폐지) |
| 활성화 조건 | 일부 클라이언트 기본 | Max/Team/Enterprise 자동, Pro는 extra usage 필요, API는 기본 |
실무 관점에서의 권장 선택
- 단일 파일 리팩토링, 짧은 Q&A: 200K로도 충분하니 굳이 1M을 의식할 필요 없습니다.
- 멀티 레포 분석, 대규모 코드베이스 리뷰: 1M이 가능한 환경(Claude Code Max/Team/Enterprise, 또는 API 직접 호출)을 선택하는 게 정신 건강에 좋습니다.
- 장시간 에이전트 워크플로우, 멀티데이 프로젝트: 1M 환경이 사실상 필수입니다. 컴팩션이 자주 일어나면 맥락이 흔들려서 결과 품질이 떨어집니다.
- 대량 문서/이미지 처리: 600장 한도가 필요한 경우 1M 환경만 가능합니다.
마무리
"Opus 4.7"과 "Opus 4.7 1M"의 차이를 한 문장으로 다시 정리하면, 모델은 같은데 클라이언트와 플랜이 그 모델의 어디까지 풀어주느냐의 차이입니다. 가격은 동일하고, 성능 자체도 동일하며, 다만 실효 컨텍스트 윈도우, 이미지 처리 한도, 컴팩션 빈도에서 큰 차이가 납니다.
만약 지금 쓰는 도구에서 Opus 4.7이 자꾸 짧게 끊긴다 싶으면, 모델 자체를 의심하기 전에 그 클라이언트가 어떤 컨텍스트 상한을 적용하고 있는지부터 확인해보시길 권합니다. 같은 모델인데 도구 때문에 잠재력의 5분의 1만 쓰고 있을 수도 있거든요. 그리고 그건 꽤 아까운 일입니다.
참고 자료
- Anthropic 공식 문서, What's new in Claude Opus 4.7: https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7
- Anthropic 공식 문서, Context windows: https://platform.claude.com/docs/en/build-with-claude/context-windows
- Anthropic 공식 문서, Pricing: https://platform.claude.com/docs/en/about-claude/pricing
- Anthropic 공식 문서, Claude Platform Release Notes: https://platform.claude.com/docs/en/release-notes/overview
- Claude Code Docs, Model configuration: https://code.claude.com/docs/en/model-config
- Claude Help Center, Context window on paid plans: https://support.claude.com/en/articles/8606394-how-large-is-the-context-window-on-paid-claude-plans
- GitHub Copilot CLI Issue #2785, 1M context support for Opus 4.7: https://github.com/github/copilot-cli/issues/2785
- Anthropic Claude Code Issue #50716, VS Code extension 1M context cap: https://github.com/anthropics/claude-code/issues/50716
- LLM Stats, Claude Opus 4.7 Launch Analysis: https://llm-stats.com/blog/research/claude-opus-4-7-launch
- Caylent Blog, Claude Opus 4.7 Deep Dive: https://caylent.com/blog/claude-opus-4-7-deep-dive-capabilities-migration-and-the-new-economics-of-long-running-agents
- CloudZero Blog, Claude Opus 4.7 Pricing 2026: https://www.cloudzero.com/blog/claude-opus-4-7-pricing/
- Finout Blog, Claude Opus 4.7 Pricing Story: https://www.finout.io/blog/claude-opus-4.7-pricing-the-real-cost-story-behind-the-unchanged-price-tag
'IT > AI' 카테고리의 다른 글
| 외장 SSD로 로컬 LLM 돌려도 괜찮을까? 외장하드 LLM 성능 영향 알아보기 (0) | 2026.05.15 |
|---|---|
| Codex 모바일 원격 접속, 진짜 폰으로 코딩이 될까? 클로드 코드 원격과도 비교 (1) | 2026.05.15 |
| Codex에 펫이 생겼다고? OpenAI의 깜찍한 신기능 Codex Pets 기능 정리 (1) | 2026.05.15 |
| 2만9천원에 풀렸던 ChatGPT Pro 선물하기 이벤트 사용 관련 QnA 총정리 (0) | 2026.05.14 |
| 구글 Gemini 3.1 Ultra 출시 200만 토큰의 의미 (2) | 2026.05.13 |