클로드코드(Claude Code)로 작업하다 보면 누구나 한 번쯤 겪는 순간이 있습니다. 변수 이름 하나 바꿔달라고 했을 뿐인데 모델이 한참 곰곰이 고민하다가 답을 내놓을 때 말이죠. "이건 그냥 빨리 좀 해주면 안 될까" 싶은 그 순간을 위해 등장한 것이 바로 /fast 명령어와 fast mode(패스트 모드)입니다.
이 글에서는 fast mode가 정확히 무엇인지, CLI와 VS Code뿐 아니라 맥 데스크톱 앱에서는 어떻게 켜는지, 2026년 5월 28일에 출시된 Claude Opus 4.8에서 무엇이 바뀌었는지, 그리고 가장 헷갈리기 쉬운 비용 구조까지 한 번에 정리하겠습니다. 결론부터 말하면 같은 Opus 모델을 약 2.5배 빠르게 굴리는 대신, 플랜에 포함된 일반 사용량이 아니라 별도의 사용 크레딧에서 돈을 내는 거래입니다. 세상에 공짜 부스트는 없다는 진리가 여기서도 통합니다.
fast 모드란 무엇인가
/fast는 클로드코드에서 fast mode를 켜고 끄는 슬래시 명령어입니다. fast mode는 Claude Opus 모델을 위한 고속 구성으로, 동일한 모델을 최대 2.5배 빠른 속도로 응답하게 만들어 줍니다. 빠른 반복 작업이나 실시간 디버깅처럼 응답이 늦으면 답답해지는 상황에서 켜고, 속도보다 비용이 더 중요한 상황에서 끄면 됩니다.
한 가지 중요한 전제. fast mode는 글을 쓰는 현재 시점 기준으로 리서치 프리뷰(research preview) 단계입니다. 즉 기능, 가격, 사용 가능 여부가 피드백에 따라 바뀔 수 있습니다. 그러니 이 글의 가격이나 정책 수치는 "지금 이 순간의 스냅샷"이라고 생각하고, 실제 사용 전에는 클로드코드에서 직접 확인하는 습관을 들이는 게 좋습니다.
핵심은 '모델을 바꾸는 것'이 아니다
가장 많이 오해하는 부분이라 먼저 강조하고 싶습니다. fast mode는 더 작고 빠른 다른 모델로 갈아타는 기능이 아닙니다.
fast mode는 Claude Opus를 그대로 사용하되, 비용 효율보다 속도를 우선하도록 API 구성을 바꾼 것입니다. 그래서 품질과 능력은 일반 모드와 완전히 동일하고, 단지 응답이 더 빠르게 나올 뿐입니다. 자동차로 비유하자면 엔진을 더 작은 것으로 교체한 게 아니라, 같은 엔진에 부스트를 거는 느낌에 가깝습니다.
지원 모델은 Opus 계열뿐입니다. Sonnet, Haiku 등 다른 모델에서는 사용할 수 없습니다. 그래서 만약 Sonnet이나 Haiku를 쓰던 중에 fast mode를 켜면 클로드코드가 자동으로 Opus로 전환합니다.
Opus 4.8와 함께 더 싸진 fast 모드
2026년 5월 28일, Anthropic이 Claude Opus 4.8을 출시하면서 fast mode에도 반가운 변화가 생겼습니다. 핵심만 추리면 다음과 같습니다.
- Opus 4.8도 fast mode를 지원합니다. fast mode가 Opus 4.7과 4.6 전용이었던 것에서, 이제 Opus 4.8까지 확장됐습니다. Claude API에서는 리서치 프리뷰로 제공되며, 클로드코드에서는 사용 크레딧을 켠 개발자라면 바로 쓸 수 있습니다.
- fast mode 가격이 3배 저렴해졌습니다. Opus 4.8의 fast mode는 속도는 그대로 약 2.5배를 유지하면서, 이전 세대 fast mode보다 3배 싸졌습니다.
- 일반 Opus 4.8 사용 단가는 그대로입니다. fast mode가 아닌 표준 Opus 4.8은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러로 4.7과 동일하게 유지됐습니다.
세대별 fast mode 가격을 정리하면 다음과 같습니다.
| 모델 | fast 모드 입력 (100만 토큰당) | fast 모드 출력 (100만 토큰당) |
| Opus 4.8 | 10달러 | 50달러 |
| Opus 4.7 · Opus 4.6 | 30달러 | 150달러 |
참고로 클로드코드 v2.1.142 이상에서는 Opus 4.7이 fast mode의 기본값으로 잡혀 있었는데, 4.8 출시 이후 사용 환경에 따라 적용 모델이 다를 수 있으니, 현재 어떤 모델이 서빙되고 있는지는 /model 명령어로 확인하는 것이 가장 확실합니다.
사용법 1: CLI와 VS Code 확장에서 켜기
가장 기본이 되는 방법입니다. 프롬프트 입력창에 /fast를 입력하고 Tab 키를 눌러 켜고 끕니다. 같은 명령어를 다시 입력하면 토글되는 방식이라, 한 번 치면 켜지고 또 한 번 치면 꺼집니다. 이 명령어는 클로드코드 CLI와 VS Code 확장에서 동일하게 동작합니다.
# 현재 버전 먼저 확인 (v2.1.36 이상 필요)
claude --version
# 클로드코드 프롬프트 안에서
/fast
# → "Fast mode ON" 메시지와 함께 프롬프트 옆에 ↯ 아이콘이 표시됩니다
fast mode가 켜진 동안에는 프롬프트 옆에 작은 번개 모양 ↯ 아이콘이 붙어, 지금 내가 어떤 모드인지 한눈에 알 수 있습니다. 상태가 헷갈리면 /fast를 다시 입력해 확인할 수 있고, /fast로 끄더라도 모델은 Opus에 그대로 머무릅니다. 이전에 쓰던 모델로 되돌아가지 않으니, 모델을 바꾸고 싶다면 /model 명령어를 따로 사용해야 합니다.
사용법 2: 맥 데스크톱 앱(Code 탭)에서 켜기
클로드코드를 맥 데스크톱 앱의 Code 탭에서 쓰는 경우도 방법은 어렵지 않습니다. 데스크톱 Code 탭은 슬래시 명령어를 지원하며, 프롬프트 박스에 /를 입력하면 내장 명령어 목록이 뜹니다. /fast도 그 내장 명령어 중 하나입니다.
- 앱을 열고 상단 Code 탭에서 세션을 시작합니다.
- 프롬프트 입력창에 /fast를 입력하고 선택합니다.
- "Fast mode ON" 메시지와 함께 ↯ 아이콘이 표시되며, 다시 /fast를 입력하면 꺼집니다.
여기서 주의할 점이 하나 있습니다. CLI에서 쓰던 Shift+Tab 같은 터미널 단축키는 데스크톱 Code 탭에는 적용되지 않습니다. 데스크톱에서는 입력창에 /fast를 직접 입력해 토글한다고 기억하면 됩니다. 또한 데스크톱 앱은 실행할 때 자동으로 업데이트되며, 맥에서는 메뉴 막대의 Claude > About Claude에서 현재 버전을 확인할 수 있습니다.
사용법 3: 설정 파일로 영구 적용
매번 켜기 귀찮다면 사용자 설정 파일에 아예 기본값으로 박아둘 수 있습니다. 데스크톱 앱과 CLI는 ~/.claude/settings.json 같은 동일한 설정 파일을 공유하기 때문에, 아래 한 줄이면 두 환경 모두에 적용됩니다.
{
"fastMode": true
}
기본적으로 fast mode 설정은 세션이 바뀌어도 유지됩니다. 한 번 켜두면 다음 세션에서도 계속 켜진 상태로 시작한다는 뜻입니다. (이 동작은 관리자 설정으로 바꿀 수 있는데, 뒤에서 다시 다루겠습니다.)
특정 모델로 고정하고 싶다면 환경 변수를 활용할 수 있습니다. 예를 들어 fast mode를 Opus 4.6으로 고정하려면 다음과 같이 설정합니다.
export CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1
비용 구조: 일반 사용량이 아니라 '사용 크레딧'에서 빠진다
이 글에서 가장 강조하고 싶은 부분입니다. 구독 플랜(Pro/Max/Team/Enterprise) 사용자 기준으로, fast mode는 플랜에 포함된 일반 사용량에서 차감되지 않고 별도의 사용 크레딧(extra usage)에서만 과금됩니다. "구독료에 포함돼 있으니 공짜로 쓰는 기능"이 아니라, 추가 비용을 감수하고 속도를 사는 기능입니다.
핵심을 정리하면 이렇습니다.
- 사용 크레딧 활성화가 전제 조건입니다. 계정에서 플랜 포함량을 초과해 과금되는 것을 허용하는 설정(사용 크레딧 / extra usage)을 켜둬야 fast mode를 쓸 수 있습니다. 개인 계정은 Console 결제 설정에서, 팀과 엔터프라이즈는 관리자가 조직 단위로 켭니다.
- 플랜 사용량이 남아 있어도 무관합니다. 일반 사용량이 아직 충분히 남아 있더라도, fast mode를 켜면 그 토큰은 첫 토큰부터 fast mode 요금으로 크레딧에서 빠져나갑니다. 플랜 포함 사용량으로는 계산되지 않습니다.
- 별도 레이트 리밋입니다. fast mode는 표준 Opus와 분리된 레이트 리밋을 가지므로, fast mode를 쓴다고 해서 일반 Opus 사용 한도를 깎아먹지 않습니다. 반대도 마찬가지입니다.
참고로 구독 플랜이 아니라 Claude Console(API, 사용량 기반 과금)로 쓰는 경우라면 "크레딧" 개념이라기보다, fast mode API 단가로 사용량만큼 그대로 청구되는 방식입니다.
중간에 켜면 손해, 시작할 때 켜면 이득
비용을 아끼는 핵심 팁이 하나 있습니다. 대화 도중에 fast mode로 전환하면, 그 시점까지 쌓인 전체 대화 컨텍스트에 대해 fast mode의 캐시되지 않은 입력 토큰 가격이 전부 적용됩니다. 다시 말해 대화를 한참 진행하다가 갑자기 켜면, 처음부터 켜두고 시작했을 때보다 돈이 더 나갑니다. 그래서 비용 효율을 최대로 챙기려면 세션 중간이 아니라 세션 시작 시점에 fast mode를 켜는 것이 유리합니다. fast mode 가격은 1M(100만) 토큰 컨텍스트 윈도우 전체에 동일하게 적용되는 플랫 요금이라, 컨텍스트가 길어진다고 단가가 달라지지는 않습니다.
언제 켜고 언제 끌까
모든 작업에 부스트가 필요한 건 아닙니다. 상황별로 정리하면 다음과 같습니다.
켜는 게 좋은 상황 (fast 모드) 끄는 게 좋은 상황 (표준 모드)
| 코드 수정을 빠르게 반복할 때 | 오래 돌아가는 자율(autonomous) 작업 |
| 실시간 디버깅 세션 | 배치 처리나 CI/CD 파이프라인 |
| 마감이 촉박한 시간 민감 작업 | 비용에 민감한 대규모 작업 |
요약하면 사람이 화면 앞에 앉아 즉각적인 반응을 기다리는 인터랙티브 작업에는 fast mode가 빛을 발하고, 백그라운드에서 알아서 오래 돌아가는 작업이나 토큰을 대량으로 태우는 코드베이스 분석에는 표준 모드가 비용 면에서 훨씬 합리적입니다.
fast 모드와 effort level은 다르다
이 둘을 헷갈리는 분들이 많은데, 효과가 명확히 다릅니다.
| fast 모드 | 동일한 모델 품질, 낮은 지연 시간, 높은 비용 |
| 낮은 effort level | 사고 시간 단축, 빠른 응답, 복잡한 작업에서는 품질이 낮아질 수 있음 |
핵심 차이는 이렇습니다. fast mode는 품질을 그대로 유지하면서 속도만 올리는 대신 돈을 더 냅니다. 반면 effort level을 낮추는 것은 모델이 생각하는 시간 자체를 줄이는 것이라, 단순 작업에서는 괜찮지만 복잡한 추론이 필요한 작업에서는 결과 품질이 떨어질 수 있습니다. 재미있는 건 이 둘을 함께 쓸 수도 있다는 점입니다. 아주 단순한 작업이라면 fast mode를 켠 상태에서 effort level까지 낮춰 최대 속도를 뽑아낼 수 있습니다.
사용 전 반드시 확인할 요건
fast mode를 쓰려면 아래 조건이 모두 충족되어야 합니다.
- 서드파티 클라우드에서는 사용 불가: Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry에서는 fast mode를 쓸 수 없습니다. Anthropic Console API, 그리고 사용 크레딧을 사용하는 Claude 구독 플랜에서만 동작합니다.
- 사용 크레딧 활성화 필요: 앞서 설명한 대로 계정에 사용 크레딧이 켜져 있어야 합니다.
- 버전 요건: 클로드코드 v2.1.36 이상이 필요합니다. CLI는 claude --version, 데스크톱 앱은 Claude > About Claude에서 확인하세요.
- 팀/엔터프라이즈는 관리자 활성화 필요: 팀과 엔터프라이즈 조직에서는 fast mode가 기본적으로 비활성화되어 있습니다. 관리자가 켜주지 않은 상태라면 /fast를 입력했을 때 조직에 의해 비활성화되었다는 안내 메시지가 표시됩니다.
조직(팀/엔터프라이즈) 환경에서의 설정
관리자는 다음 위치에서 fast mode를 켤 수 있습니다.
- Console (API 고객): Claude Code preferences
- Claude AI (팀/엔터프라이즈): Admin Settings > Claude Code
반대로 조직 전체에서 fast mode를 완전히 막고 싶다면 환경 변수를 사용합니다.
export CLAUDE_CODE_DISABLE_FAST_MODE=1
여러 세션을 동시에 돌리는 환경에서 비용이 새는 것을 막고 싶다면, 세션마다 매번 옵트인하도록 강제할 수도 있습니다. 관리형 설정에 다음을 추가하면 모든 세션이 fast mode 꺼진 상태로 시작하고, 필요할 때마다 사용자가 직접 /fast로 켜야 합니다.
{
"fastModePerSessionOptIn": true
}
사용자의 fast mode 선호 자체는 저장되어 있어서, 이 설정을 다시 제거하면 원래의 "세션 간 유지" 기본 동작으로 돌아갑니다.
레이트 리밋과 똑똑한 자동 폴백
fast mode는 표준 Opus와는 별도의 레이트 리밋을 가집니다. 그렇다면 한도를 다 쓰거나 크레딧이 떨어지면 작업이 뚝 끊길까요? 다행히 그렇지 않습니다. 클로드코드는 다음과 같이 우아하게 처리합니다.
- fast mode가 자동으로 표준 속도로 폴백(fallback)됩니다.
- ↯ 아이콘이 회색으로 바뀌어 쿨다운 상태임을 알려줍니다.
- 표준 속도와 표준 가격으로 작업을 계속 이어갈 수 있습니다.
- 쿨다운이 끝나면 fast mode가 자동으로 다시 켜집니다.
에러 메시지로 작업 흐름이 깨지는 일 없이, 속도 부스트만 잠깐 빠졌다가 돌아오는 셈입니다. 쿨다운을 기다리지 않고 직접 끄고 싶다면 /fast를 한 번 더 입력하면 됩니다.
마무리: 작은 명령어, 체감되는 차이
/fast는 거창한 기능은 아닙니다. 모델을 바꾸지도 않고, 마법처럼 똑똑해지게 만들지도 않습니다. 단지 "지금은 깊이 고민할 필요 없으니 빨리 좀 내놔" 하는 순간을 위한 가속 페달일 뿐입니다.
그래서 추천하는 리듬은 이렇습니다. 설계나 큰 리팩터링처럼 신중함이 필요한 단계에서는 표준 모드로 차분히 생각하게 두고, 코드 작성이나 빠른 반복, 실시간 디버깅처럼 손이 바쁜 단계에서만 fast mode를 켜는 것입니다. 비용은 세션 시작 시점에 켜야 가장 아낄 수 있다는 점, 그리고 그 비용이 플랜 포함 사용량이 아니라 별도 사용 크레딧에서 빠진다는 점만 기억하면 됩니다.
Opus 4.8과 함께 fast mode 가격이 3배 저렴해진 만큼, 예전보다 부담 없이 켜볼 만해졌습니다. 다만 여전히 리서치 프리뷰라 정책은 또 바뀔 수 있으니, /cost 명령어로 토글 전후의 토큰 사용량을 직접 비교해 보면서 자신의 작업 패턴에 맞는 적정선을 찾아보시길 권합니다. 단순 작업에서의 그 매끄러운 속도감을 한번 맛보면, 다음부터는 자연스럽게 손이 /fast로 향하게 될 겁니다.
참고 자료
- Speed up responses with fast mode, Claude Code 공식 문서: https://code.claude.com/docs/en/fast-mode
- Desktop application, Claude Code 공식 문서: https://code.claude.com/docs/en/desktop
- What's new in Claude Opus 4.8, Claude API 공식 문서: https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-8
- Fast mode 안내 및 대기자 명단: https://claude.com/fast-mode
- Model configuration (effort level), Claude Code 공식 문서: https://code.claude.com/docs/en/model-config
- Manage costs effectively, Claude Code 공식 문서: https://code.claude.com/docs/en/costs
- Anthropic launches Claude Opus 4.8 with better coding and lower fast mode pricing, Neowin: https://www.neowin.net/news/anthropic-launches-claude-opus-48-with-better-coding-and-lower-fast-mode-pricing/
'IT > AI' 카테고리의 다른 글
| Claude Opus 4.8 출시 총정리: 이전 프론티어 모델과 전격 비교 그리고 솔직한 실사용 후기 (1) | 2026.05.29 |
|---|---|
| 클로드코드에서 팀 플랜과 일반 플랜의 차이점은 무엇일까: 사용량, 관리 기능, 프라이버시까지 한 번에 정리 (3) | 2026.05.24 |
| ChatGPT에서 팀 플랜과 일반 플랜의 차이점 총정리 (3) | 2026.05.23 |
| Codex 2026년 5월 업데이트 총정리: 이제 코딩이 출근길에서도 끝난다고요? (2) | 2026.05.22 |
| 카카오 ChatGPT Pro 이용권 5개 사용예정 취소로 분할 사용 가능? 유효기간 8월 마감자 필독 가이드 (0) | 2026.05.22 |