새 모델 나왔다는 소식 들을 때마다 "또?"라는 말이 먼저 튀어나오는 분들 많으시죠. 저도 그랬습니다. 그런데 이번 건은 좀 다릅니다. 2026년 6월 9일, Anthropic이 그동안 소수 기관에만 쥐여주던 미토스(Mythos) 클래스 모델을 드디어 일반 사용자에게 풀었거든요. 이름하여 Claude Fable 5. 그리고 같은 날, 안전장치를 일부 풀어버린 형제 모델 Claude Mythos 5도 함께 공개됐습니다.
오늘은 클로드 코드(Claude Code)에서 바로 쓸 수 있는 이 따끈따끈한 Fable 5를, 형제 격인 미토스 모델과 GPT-5.5, 제미나이 같은 다른 프론티어 모델들과 나란히 놓고 뜯어보겠습니다. 벤치마크 숫자가 좀 많이 나오는데, 커피 한 잔 챙기시는 걸 추천드립니다.
Claude Fable 5가 대체 뭔데요?
먼저 정체부터 정리하고 갑시다. Fable 5는 Anthropic이 일반 공개한 모델 중 가장 강력한 모델입니다. 기존에는 Haiku, Sonnet, Opus 이렇게 세 라인이 있었는데, Fable 5는 그 위에 새로 생긴 "미토스 클래스(Mythos-class)" 등급에 속합니다. 한마디로 Opus보다 한 단계 위 체급이라는 뜻입니다.
핵심 스펙을 표로 정리하면 이렇습니다.
| 출시일 | 2026년 6월 9일 |
| API 모델 ID | claude-fable-5 |
| 컨텍스트 윈도우 | 기본 100만(1M) 토큰 |
| 최대 출력 | 요청당 12.8만(128k) 토큰 |
| 가격 | 입력 100만 토큰당 10달러 / 출력 100만 토큰당 50달러 |
| 사용 가능 채널 | Claude API, Claude Platform, 클로드 코드, 엔터프라이즈, AWS Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
가격이 Opus 4.8의 정확히 2배입니다. 비싸다고 느껴지면 정상입니다. 다만 입력 토큰은 프롬프트 캐싱을 쓰면 최대 90% 할인이 들어가니, 같은 컨텍스트를 반복해서 던지는 에이전트 작업이라면 체감 비용은 생각보다 덜 무섭습니다.
기술적으로 재미있는 포인트가 두 가지 있습니다.
첫째, 적응형 사고(Adaptive thinking)가 항상 켜져 있습니다. Fable 5와 미토스 5에서는 이게 유일한 사고 모드라서, 아예 끌 수가 없습니다(thinking: {"type": "disabled"} 미지원). 대신 effort 파라미터로 사고의 깊이를 조절합니다. 쉬운 일에는 낮게, 오래 걸리는 어려운 일에는 xhigh로 올려주는 식이죠.
둘째, 원본 사고 과정(raw chain-of-thought)은 절대 반환되지 않습니다. thinking.display가 기본값 omitted라 빈 블록만 돌아오고, 읽을 수 있는 요약본이 필요하면 summarized로 바꿔야 합니다. 멀티턴 대화에서는 받은 사고 블록을 그대로 다시 넘겨주는 게 규칙입니다.
Fable 5 vs 미토스(Mythos) 5: 같은 엔진, 다른 브레이크
여기가 오늘 글의 하이라이트입니다. 많은 분들이 "Fable 5랑 미토스 5 중에 뭐가 더 세요?"라고 물어보시는데, 정답은 살짝 김 빠지지만 명쾌합니다. 둘은 같은 모델입니다. 진짜로 동일한 기반 모델을 씁니다.
차이는 딱 두 가지, 안전장치와 접근 권한입니다.
- Claude Fable 5: 안전 분류기(safety classifier)가 달려 있습니다. 사이버보안, 생물학 등 고위험 요청이 들어오면 자동으로 Opus 4.8로 우회시킵니다. 이 분류기는 전체 세션의 5% 미만에서만 작동합니다. 누구나 쓸 수 있습니다.
- Claude Mythos 5: 같은 모델에서 일부 안전장치를 덜어낸 버전입니다. API ID는 claude-mythos-5. 일반 공개가 아니라, 프로젝트 글래스윙(Project Glasswing)을 통해 승인된 고객에게만 제한적으로 제공됩니다.
미토스라는 이름이 갑자기 튀어나온 게 아닙니다. 그 조상 격인 Claude Mythos Preview가 2026년 4월에 먼저 등장했는데, AWS, Microsoft, Apple, CrowdStrike 같은 파트너들이 참여한 폐쇄 프로그램에서만 돌아갔습니다. 왜 그렇게 꽁꽁 싸맸냐고요? 이 모델이 주요 운영체제와 브라우저에서 제로데이 취약점을 스스로 찾아내고 연쇄적으로 엮어내는(chain) 능력을 보여줬기 때문입니다. 방어용 보안 전문가와 핵심 인프라 관리자에게만 열어둔 이유가 여기 있습니다.
그래서 미토스 5는 지금도 사이버보안 같은 영역에서 모델의 진짜 실력을 다 끌어내야 하는 승인된 사용자용이고, 우리 같은 일반 개발자는 Fable 5를 쓰면 됩니다. Anthropic 표현을 빌리면 "같은 차에 브레이크만 다르게 단" 셈입니다.
흥미로운 건 벤치마크입니다. Fable 5가 미토스 5에 코딩 점수에서 아주 미세하게 뒤지는 구간이 있는데(SWE-bench Verified 95.0% 대 95.5%, Terminal-Bench 84.3% 대 88%), 시스템 카드는 이걸 "능력 차이가 아니라 안전 우회 때문"이라고 못 박습니다. 실제로 Terminal-Bench에서 Fable 5 시도 중 약 20.9%가 진행 도중 안전 거부에 걸려 Opus 4.8로 폴백됐습니다. 즉, 머리가 나쁜 게 아니라 브레이크가 가끔 밟힌 거죠.
프론티어 모델 벤치마크 비교: 숫자로 보는 줄세우기
자, 이제 다른 동네 모델들과 붙여보겠습니다. 비교 대상은 OpenAI의 GPT-5.5, Google DeepMind의 제미나이(Gemini), 그리고 같은 식구인 Opus 4.8입니다.
코딩 우열은 "어떤 하네스(harness)로 쟀느냐"에 따라 결과가 뒤집힙니다. GPT-5.5는 자체 Codex CLI 환경에서 Terminal-Bench 2.1 기준 83.4%를 찍는데, 이건 터미널 중심 작업에서 매우 강력한 수치입니다. 정리하면 이렇습니다.
- 터미널에서 명령어 위주로 일한다: GPT-5.5의 Codex 통합이 강세
- 레포지토리 전체를 이해하고 이슈를 끝까지 해결한다: Claude 계열이 강세
즉 벤치마크 숫자 하나만 보고 "얘가 짱"이라고 결론 내리면 안 되고, 본인 파이프라인에서 둘 다 돌려보는 게 정답입니다.
코딩 말고 다른 영역도 보겠습니다.
| 벤치마크 | Fable 5 | GPT-5.5 | 비고 |
| GDPval-AA (지식 노동) | 1932 | 1769 | 제미나이 3.5 Flash는 1656 |
| 컴퓨터 사용 | 85.0% | 78.7% | - |
| HealthBench Professional | 66.0% | 51.8% | Opus 4.8은 56.9% |
여기에 더해, 분석 도구 회사 Hex는 Fable 5가 복잡하고 오래 걸리는 분석 작업 벤치마크에서 처음으로 90%를 넘긴 모델이라고 밝혔습니다. 이전 Opus 모델 대비 10점 가까이 뛴 수치입니다. 결제 회사 Stripe는 5천만 줄짜리 루비(Ruby) 코드베이스 전체 마이그레이션을 하루 만에 끝냈다고 했는데, Anthropic은 원래 팀 전체가 두 달 넘게 매달릴 일이라고 설명했습니다.
제미나이는 지금 어디쯤?
제미나이 진영도 짚고 넘어가야 공평하겠죠. 2026년 5월 19일 Google I/O 2026에서 Gemini 3.5 Flash가 공개됐고, 현재 제미나이 앱과 검색 AI 모드의 기본 모델로 깔려 있습니다. 코딩과 에이전트 작업에 맞춰 튜닝된 모델로, Terminal-Bench 2.1 76.2%, MCP Atlas 83.6%, 멀티모달 이해 지표인 CharXiv에서 84.2%를 기록했습니다. 속도와 가격 대비 성능이 강점입니다.
진짜 플래그십인 Gemini 3.5 Pro는 같은 자리에서 발표만 하고 아직 정식 출시는 안 됐습니다. 순다르 피차이가 무대에서 "다음 달까지 시간을 달라"고 했고, 6월 일반 공개를 목표로 하고 있습니다. 200만 토큰 컨텍스트와 Deep Think 추론 모드를 내세우고 있으니, 이게 나오면 프론티어 코딩 경쟁 구도가 또 한 번 흔들릴 가능성이 큽니다. 일단 지금 시점(6월 10일)에는 Flash가 현역, 3.1 Pro가 깊은 추론용 대기조입니다.
참고로 오픈소스 진영도 만만치 않습니다. GLM-5는 SWE-bench Verified에서 제미나이 3 Pro를 앞서는 등 오픈소스 중 최고 수준을 찍었고, 알리바바의 Qwen 계열도 프론티어 추론 모델을 연달아 내놓고 있습니다. 프론티어가 더 이상 미국 빅테크 전유물이 아니라는 신호입니다.
클로드 코드에서 Fable 5 써먹기
이론은 됐고, 실제로 어떻게 쓰냐가 중요하죠. Fable 5는 출시 당일부터 클로드 코드에서 바로 사용할 수 있습니다.
세션 안에서 모델을 바꾸려면 슬래시 명령을 쓰면 됩니다.
# 클로드 코드 실행 시 모델 지정
claude --model claude-fable-5
# 또는 세션 안에서 즉시 전환
/model claude-fable-5
API로 직접 부를 때는 모델 ID만 갈아끼우면 끝입니다.
운영 측면에서 알아두면 좋은 디테일도 있습니다. Fable 5가 요청을 거부하면 에러가 아니라 정상 응답(HTTP 200)으로 stop_reason: "refusal"이 돌아옵니다. 그리고 어떤 분류기가 막았는지도 함께 알려줍니다. 이때 fallbacks 파라미터를 넘기면 다른 Claude 모델로 자동 재시도가 가능하고, 출력이 생성되기 전에 거부된 요청은 과금되지 않습니다. 폴백으로 모델을 갈아탈 때는 프롬프트 캐시 전환 비용을 환급해주는 폴백 크레딧도 있습니다. 안전장치를 비용 폭탄 없이 우아하게 다루라는 배려입니다.
한 가지 더. effort를 올리면 코딩 정확도가 실제로 올라갑니다. 시스템 카드 기준 SWE-bench Pro는 low에서 xhigh로 갈수록 75.0%에서 80.4%로, FrontierCode Diamond는 11.5%에서 30.9%로 뜁니다. 그러니 사고 예산(thinking budget)을 정확도로 환산해주는 이 모델은, 진짜 어려운 장기 작업에만 xhigh를 아껴 쓰고 평소엔 적당히 낮춰서 비용 곡선을 관리하는 게 현명합니다.
그래서 누가 뭘 써야 할까요?
길었으니 한 줄씩 정리하겠습니다.
- 복잡한 코드베이스 전체를 이해하고 다중 파일 리팩터링, 며칠짜리 장기 세션을 돌린다: Fable 5를 xhigh로
- 비용이 빠듯하고 일상적인 코딩 자동화가 대부분이다: Opus 4.8로도 충분 (어차피 Fable 5가 막히면 폴백되는 모델입니다)
- 터미널 명령어 위주 작업, 그리고 이미 OpenAI 생태계에 깊게 들어가 있다: GPT-5.5의 Codex 하니스가 가성비 좋음 (토큰 단가가 절반 수준)
- 속도와 가격, 멀티모달이 중요하다: 제미나이 3.5 Flash, 그리고 곧 나올 3.5 Pro 대기
- 방어 목적의 사이버보안, 생명과학 고위험 연구를 승인받아 한다: 미토스 5 (글래스윙 통해 계정 담당자에게 문의)
결론적으로 Fable 5는 "벤치마크 줄세우기 1등"이 맞긴 한데, 가격이 Opus의 2배라는 점을 늘 머리 한쪽에 두셔야 합니다. 모든 작업에 최상위 모델을 박는 건 람보르기니로 동네 마트 가는 격이거든요. 어려운 일에만 꺼내 쓰고, 나머지는 적절히 라우팅하는 분이 결국 비용도 아끼고 결과물도 잘 뽑습니다.
새 모델은 앞으로도 계속 쏟아질 겁니다. 중요한 건 매번 갈아타는 게 아니라, 내 작업에 맞는 모델을 골라 쓰는 감각을 키우는 것이라고 생각합니다. 오늘 글이 그 감각에 작은 보탬이 됐길 바랍니다.
참고 자료
- Anthropic, Introducing Claude Fable 5 and Claude Mythos 5 (공식 문서): https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5
- Anthropic Claude Platform 릴리스 노트: https://platform.claude.com/docs/en/release-notes/overview
- Fast Company, Anthropic releases a version of its vaunted Mythos model to developers: https://www.fastcompany.com/91556393/anthropic-mythos-developer-version
- 9to5Mac, Anthropic just released public Mythos-class AI model called Claude Fable: https://9to5mac.com/2026/06/09/anthropic-just-released-public-mythos-class-ai-model-called-claude-fable-details-here/
- Weights & Biases (ml-news), Claude Fable 5 Benchmark Scores: https://wandb.ai/byyoung3/ml-news/reports/Claude-Fable-5-Benchmark-Scores--VmlldzoxNzE3NTE3MQ
- digitalapplied, Claude Fable 5 vs GPT-5.5 비교: https://www.digitalapplied.com/blog/claude-fable-5-vs-gpt-5-5-frontier-comparison-2026
- digitalapplied, Claude Fable 5 & Mythos 5 Agentic Coding Deep Dive (시스템 카드 분석): https://www.digitalapplied.com/blog/claude-fable-5-mythos-5-agentic-coding-deep-dive-2026
- vals.ai, SWE-bench Verified 리더보드: https://www.vals.ai/benchmarks/swebench
- Google Cloud Blog, Innovations from Google I/O 26: https://cloud.google.com/blog/products/ai-machine-learning/innovations-from-google-io-26-on-google-cloud
- TechTimes, Google Gemini 3.5 Pro Nears June Launch: https://www.techtimes.com/articles/317919/20260606/google-gemini-35-pro-nears-june-launch-2-million-token-context-deep-think-reasoning.htm
'IT > AI' 카테고리의 다른 글
| Claude Fable 5와 Mythos 5 사용중지: 미국 정부 수출통제 사태 총정리 (2) | 2026.06.13 |
|---|---|
| 클로드코드 울트라코드(Ultracode)란? (0) | 2026.06.11 |
| 유아 디지털 교육에서 교사의 역할과 XR 콘텐츠 활용 (3) | 2026.06.11 |
| MCP vs Skills, 도대체 뭐가 다른 건가요? (1) | 2026.06.10 |
| 드디어 봉인 풀린 미토스, Claude Fable 5 전격 분석: Opus 4.8·GPT-5.5·Gemini와 비교 (3) | 2026.06.10 |