[AI] Anthropic, Claude Opus 4.8 출시 — Dynamic Workflows와 성능 대폭 향상
서론
Anthropic이 2026년 5월 28일, 자사 플래그십 모델인 Claude Opus 4.8을 공식 출시했다. Opus 4.7 대비 에이전트 코딩, 다분야 추론, 컴퓨터 사용, 지식 업무 등 거의 모든 벤치마크 지표에서 성능이 향상됐으며, Claude Code에는 대규모 작업을 다루기 위한 Dynamic Workflows 기능이 새로 추가됐다. 출시 가격은 이전 버전과 동일하게 유지하면서도 Fast Mode 비용은 기존 대비 3분의 1 수준으로 낮췄다는 점도 주목할 만하다.
AI 에이전트 시대가 본격화되면서 단순히 “답변을 잘 내놓는 모델”보다 “복잡한 작업을 자율적으로, 그리고 믿고 맡길 수 있는 모델”이 중요해지고 있다. Opus 4.8은 그 방향성을 구체화한 업데이트다. 특히 정직성(Honesty) 개선 — 불확실한 판단을 명시적으로 알리고 근거 없는 주장을 줄이는 방향 — 은 에이전트 태스크 신뢰도와 직결되는 부분이라 주목받고 있다.
이번 글에서는 Opus 4.8의 주요 변경 사항, Dynamic Workflows의 동작 방식, 가격 정책, 그리고 업계와 커뮤니티의 반응을 정리한다.
본론
주요 벤치마크 향상
Anthropic이 공개한 수치를 보면 전반적인 에이전트 능력이 의미 있는 수준으로 향상됐음을 확인할 수 있다.
| 평가 항목 | Opus 4.7 | Opus 4.8 | 변화 |
|---|---|---|---|
| 에이전트 코딩 | 64.3% | 69.2% | +4.9%p |
| 멀티도메인 추론 (툴 포함) | 54.7% | 57.9% | +3.2%p |
| 에이전트 컴퓨터 사용 | 82.8% | 83.4% | +0.6%p |
| 지식 업무 (Knowledge Work Score) | 1,753 | 1,890 | +137 |
에이전트 코딩 점수가 5%포인트 가까이 뛰어오른 점이 특히 눈에 띈다. 반복적인 코드 리팩토링, 멀티파일 수정, 테스트 코드 생성, 버그 추적 등 실무에서 요구되는 자율 코딩 작업에서의 신뢰도가 한층 높아졌다는 의미다.
멀티도메인 추론의 경우, “툴 포함”이라는 조건이 중요하다. 순수 언어 추론이 아니라 코드 실행, 웹 검색, API 호출 등 외부 툴을 활용하는 실제 에이전트 환경에서의 점수다. 이 수치가 오른다는 것은 에이전트가 올바른 툴을 적절한 타이밍에 사용하는 능력이 향상됐음을 의미한다.
Dynamic Workflows — Claude Code의 핵심 신기능
이번 업데이트에서 가장 화제가 된 기능은 Claude Code에 추가된 Dynamic Workflows다.
기존 Claude Code는 단일 세션 내에서 연속적인 작업이 가능했지만, 규모가 매우 큰 프로젝트 — 수백 개 파일에 걸친 리팩토링, 여러 독립적인 서브태스크로 구성된 마이그레이션, 크로스 레포지토리 의존성 업데이트 — 를 처리하기에는 구조적인 한계가 있었다. 단일 컨텍스트 창 내에서 모든 작업 상태를 유지해야 했기 때문이다.
Dynamic Workflows는 이 문제를 해결하기 위해 Claude Code가 런타임에 작업을 더 작은 단위로 동적으로 분해하고, 각 단위를 독립적인 서브 에이전트 태스크로 실행한 뒤 결과를 합치는 방식으로 작동한다.
TechCrunch 보도에 따르면, 초기 테스터들은 이 기능 덕분에 다음과 같은 작업을 처리할 수 있게 됐다고 전했다.
- 수천 개 파일에 걸친 API 인터페이스 교체
- 레거시 코드베이스 전체 테스트 커버리지 작성
- 멀티 레포지토리 환경에서의 의존성 동기화
기술적으로는 Claude Code 자체가 작업 의존성 그래프를 구성하고, 독립적인 서브태스크는 병렬로, 의존성이 있는 작업은 순차적으로 실행하는 오케스트레이션 레이어를 갖게 된다. “더 긴 컨텍스트를 지원한다”는 것과는 다른 접근이다 — 컨텍스트를 늘리는 것이 아니라, 큰 문제를 구조적으로 분할하는 방식이다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[Dynamic Workflows 동작 개념도]
사용자 요청: "이 레포지토리의 모든 API를 v2로 마이그레이션해줘"
↓
Claude Code → 작업 분해 & 의존성 분석
↓
┌───────────────────────────────────┐
│ 서브태스크 1: 현재 API 인벤토리 파악 │ ←── 병렬 실행
│ 서브태스크 2: v2 스펙 분석 │ ←── 병렬 실행
└───────────────────────────────────┘
↓ (1, 2 완료 후)
┌───────────────────────────────────┐
│ 서브태스크 3: 파일 A~Z 순차 마이그레이션 │
└───────────────────────────────────┘
↓
결과 합성 및 검증
이 구조는 Anthropic이 Code with Claude London(2026년 5월 19-20일)에서 발표한 Claude Managed Agents 플랫폼과도 맞닿아 있다. Opus 4.8이 이 플랫폼의 핵심 모델로 기능하게 되며, 개발자가 Claude 기반 에이전트를 더 쉽게 프로덕션 환경에 배포하고 모니터링할 수 있는 인프라를 제공한다.
정직성(Honesty) 강화 — 에이전트 신뢰도의 핵심
Anthropic은 이번 릴리스에서 모델의 정직성 향상도 강조했다. Opus 4.8은 Opus 4.7 대비 두 가지 측면에서 구체적으로 개선됐다.
1. 불확실한 판단의 명시적 표현
작업 결과에 자신이 없을 때 “이 부분은 확실하지 않습니다”, “다른 접근을 고려해볼 수 있습니다”와 같이 명확히 표현하는 경향이 강화됐다. 이전 모델들은 종종 틀린 판단도 확신에 차서 내놓는 경향이 있었는데, Opus 4.8은 이를 의식적으로 줄였다.
2. 뒷받침 없는 주장 감소
근거 데이터나 논리 없이 단정적인 발언을 하는 빈도가 줄었다. 특히 수치 예측, 외부 시스템 동작에 대한 가정 등에서 이 개선이 두드러진다고 보고됐다.
에이전트 태스크에서 정직성은 단순한 미덕이 아니라 실용적인 신뢰성 지표다. 자율적으로 작업을 수행하는 도중 모델이 잘못된 확신으로 엉뚱한 방향으로 진행하면 — 예컨대 실제로 존재하지 않는 함수를 있다고 믿고 코드를 수백 줄 작성하는 경우 — 복구 비용이 상당하다. Appwrite 블로그와 Axios의 보도에 따르면, Anthropic 내부 테스터들은 “Opus 4.8이 에이전트 작업 시 더 신중하고 판단력이 예리하다”고 평가했다.
Fast Mode 가격 인하 및 노력 조절 기능
기존 Opus 시리즈에서도 제공되던 Fast Mode — 추론 깊이를 줄이되 출력 속도를 높이는 모드 — 가 Opus 4.8에서 기존 대비 3배 저렴해졌다. 정확한 토큰당 단가는 공개되지 않았으나, 지연 시간에 민감한 애플리케이션 — 실시간 코드 완성, 대화형 에이전트, 스트리밍 워크플로우 — 에서의 비용 부담이 크게 줄어들 전망이다.
또한 claude.ai 사용자에게는 작업 노력 수준(effort level)을 직접 조절하는 컨트롤이 새로 추가됐다. 간단한 질문에는 빠른 응답을, 복잡한 분석이나 장기 에이전트 작업에는 더 많은 리소스를 투입하도록 사용자가 직접 설정할 수 있다. OpenAI의 o-series 모델이 reasoning_effort 파라미터를 API로 노출하는 것과 유사한 방향이나, Anthropic은 이를 UX 레이어에서 직접 제공하는 방식을 택했다.
가격 및 가용성
Anthropic은 Opus 4.7과 동일한 API 가격을 유지한다고 발표했다. API 및 claude.ai에서 모두 2026년 5월 28일부터 즉시 사용 가능하다.
1
2
3
4
5
모델 ID: claude-opus-4-8
출시일: 2026-05-28
가용 지역: 전 세계 (API + claude.ai)
기본 API 가격: Opus 4.7과 동일
Fast Mode 가격: 기존 Opus Fast Mode 대비 3배 인하
업계와 커뮤니티의 반응
TechCrunch는 “Dynamic Workflows는 단순히 성능을 끌어올리는 것을 넘어, Claude Code가 엔터프라이즈급 소프트웨어 개발 파이프라인에 실질적으로 통합될 수 있는 기반을 만든다”고 평가했다. 특히 대형 기술 기업들이 AI 코딩 에이전트를 실제 개발 파이프라인에 도입하는 사례가 늘고 있는 시점에, 이 기능은 차별점이 될 수 있다고 분석했다.
9to5Mac은 “이번 업데이트에서 가장 인상적인 점은 가격을 올리지 않으면서 Fast Mode 비용을 3분의 1로 낮춘 것”이라고 짚었다. MacRumors 역시 에이전트 코딩 점수 향상과 정직성 개선에 주목하며 “모델 품질이 단순한 정답률 이상, 실용적인 신뢰도 기준으로 평가받기 시작했다”고 분석했다.
Axios는 이번 Opus 4.8이 Anthropic 내부 개발 코드명 “Mythos” 프로젝트에서 파생됐다고 보도했다. Anthropic이 이 프로젝트를 통해 에이전트 신뢰성과 자율성 두 축을 동시에 끌어올리는 연구에 집중해왔음을 시사한다.
개발자 커뮤니티에서는 Dynamic Workflows에 대한 기대감이 높다. 대규모 모노레포를 다루는 팀, 레거시 시스템 현대화 프로젝트, 혹은 자동화된 테스트 생성 파이프라인에 Claude Code를 활용하려는 팀에서 이 기능이 어느 수준까지 실질적으로 도움이 될지에 대한 검증 사례가 조만간 쏟아질 것으로 보인다.
Anthropic이 함께 공개한 Claude Managed Agents 플랫폼과 결합되면, 개발자는 Opus 4.8 기반의 자율 에이전트를 직접 설계하고, 프로덕션에 배포하고, 실행 이력을 모니터링하는 전체 라이프사이클을 하나의 플랫폼에서 관리할 수 있게 된다. 이는 AI 코딩 툴이 “도구”를 넘어 “동료”에 가까운 형태로 진화하고 있음을 보여주는 흐름이다.
정리
- Anthropic이 2026년 5월 28일 Claude Opus 4.8을 정식 출시했다.
- 에이전트 코딩 +4.9%p, 멀티도메인 추론 +3.2%p, 컴퓨터 사용 +0.6%p, 지식 업무 점수 1753→1890으로 전 항목에서 Opus 4.7 대비 성능 향상.
- Claude Code에 추가된 Dynamic Workflows는 대형 태스크를 런타임에 서브 에이전트 단위로 분해해 병렬/순차 처리한다.
- 정직성 강화 — 불확실한 판단을 명시하고 근거 없는 주장을 줄이는 방향으로 개선돼 에이전트 신뢰도가 높아졌다.
- Fast Mode 가격이 기존 대비 3배 인하, 기본 API 가격은 Opus 4.7과 동일하게 유지됐다.
- claude.ai에서 노력 조절 컨트롤이 추가돼 작업 복잡도에 따라 모델 리소스 투입 수준을 직접 설정할 수 있다.
- 에이전트 AI를 프로덕션에 적용 중이거나 대규모 코드베이스를 다루는 팀이라면 Dynamic Workflows 도입을 우선적으로 검토할 만하다.
Reference
- Anthropic — Introducing Claude Opus 4.8
- TechCrunch — Anthropic releases Opus 4.8 with new dynamic workflow tool
- 9to5Mac — Anthropic upgrades Claude with new Opus 4.8 model
- MacRumors — Anthropic Launches Claude Opus 4.8 With Gains in Coding and Honesty
- Axios — Anthropic releases Claude Opus 4.8
- Appwrite Blog — Anthropic just launched Claude Opus 4.8 with fast mode and dynamic workflows