Models

Kiro에서 사용할 수 있는 AI 모델 라인업과 작업 성격에 맞춰 모델을 고르는 방법을 정리합니다.

개요

Kiro는 정밀도가 중요한 아키텍처 작업에 적합한 프런티어급 모델부터, 길게 이어지는 코딩 세션에서 부담을 줄여 주는 경량 오픈웨이트 모델까지 폭넓게 제공합니다. 채팅 입력창의 모델 드롭다운에서 직접 선택할 수도 있고, Auto를 사용하면 Kiro가 작업 성격에 따라 적합한 모델을 자동으로 라우팅합니다.

모델 비교표

비용 배수는 Auto를 1.0x 기준으로 한 상대 값입니다. 예를 들어 Auto에서 10크레딧이 드는 작업은 Opus에서는 22, Haiku에서는 4, Qwen3 Coder Next에서는 0.5 수준에서 처리됩니다.

참고: 크레딧 배수가 같아도 작업당 소비 크레딧이 반드시 같지는 않습니다. 실제 소비량은 모델이 생성하는 토큰 수, 내부 thinking 깊이, 토크나이저 차이 등에 따라 달라집니다. 예를 들어 Opus 4.8은 Opus 4.6과 비교해 업데이트된 토크나이저를 사용하므로, 동일한 프롬프트와 응답이라도 토큰 수가 다르게 계산되어 두 모델 모두 2.2x 배수를 갖더라도 실제 크레딧 비용이 달라질 수 있습니다.

모델	컨텍스트	비용 배수	리전	이용 가능 티어
Claude Opus 4.8	1M	2.2x	us-east-1, eu-central-1	Pro, Pro+, Power
Claude Opus 4.7	1M	2.2x	us-east-1, eu-central-1	Pro, Pro+, Power
Claude Opus 4.6	1M	2.2x	us-east-1, eu-central-1	Pro, Pro+, Power
Claude Opus 4.5	200K	2.2x	us-east-1, eu-central-1	Pro, Pro+, Power
Claude Sonnet 5	1M	1.3x	us-east-1	Pro, Pro+, Power
Claude Sonnet 4.6	1M	1.3x	us-east-1, eu-central-1	Pro, Pro+, Power
Claude Sonnet 4.5	200K	1.3x	us-east-1, eu-central-1	Free, Pro, Pro+, Power
Claude Sonnet 4.0	200K	1.3x	us-east-1, eu-central-1	Free, Pro, Pro+, Power
Auto	—	1.0x	us-east-1, eu-central-1	Free, Pro, Pro+, Power
Claude Haiku 4.5	200K	0.4x	us-east-1, eu-central-1	Pro, Pro+, Power
GLM-5	200K	0.5x	us-east-1	Free, Pro, Pro+, Power
DeepSeek 3.2	128K	0.25x	us-east-1	Free, Pro, Pro+, Power
MiniMax M2.5	200K	0.25x	us-east-1, eu-central-1	Free, Pro, Pro+, Power
MiniMax M2.1	200K	0.15x	us-east-1, eu-central-1	Free, Pro, Pro+, Power
Qwen3 Coder Next	256K	0.05x	us-east-1, eu-central-1	Free, Pro, Pro+, Power

모델 전환 방법

채팅 패널 하단의 모델 드롭다운을 엽니다.
원하는 모델을 선택합니다.
해당 대화에서 이후 보내는 모든 메시지에 선택이 반영됩니다.

대화 도중 모델을 바꿔도 지금까지의 컨텍스트는 유지되므로, 까다로운 단계에서만 잠시 Opus로 올렸다가 다시 Sonnet으로 내려도 됩니다.

상황별 추천

일반 개발 작업 → Auto: 품질과 비용을 자동으로 절충.
예측 가능한 기준 동작 → Sonnet 4.0.
강력한 에이전틱 코딩 → Sonnet 4.5.
낮은 비용으로 Opus에 근접한 에이전틱 작업 → Sonnet 5: 추론·도구 사용에서 Opus 4.8에 근접하며, 편집 전에 계획을 세우고 더 오래 자율적으로 실행합니다.
효율 좋은 고지능 작업 → Sonnet 4.6.
최고 수준의 신뢰도 → Opus 4.8.
작업 난이도에 맞춘 추론 깊이 → Opus 4.7(adaptive thinking).
장시간 디버깅·세션 → Opus 4.6.
여러 시스템에 걸친 아키텍처 설계 → Opus 4.5.
속도와 크레딧 절약 → Haiku 4.5.
저비용 프런티어 코딩 → MiniMax M2.5.
리포지토리 단위 에이전트 작업 → GLM-5.
최저 비용 코딩 → DeepSeek 3.2.
다국어 프로그래밍 → MiniMax M2.1.
예산이 빠듯한 장시간 세션 → Qwen3 Coder Next.

모델 가용성

모델 가용성은 국가나 리전에 따라 달라질 수 있습니다. Kiro의 모델 제공 범위는 각 공급자의 이용 및 지역 요건을 따릅니다. 자세한 지원 국가·리전 정보는 각 공급자의 안내를 참고하세요: Anthropic, MiniMax, Zhipu AI(GLM), DeepSeek, Qwen.

주요 모델 특징

Auto (권장)

여러 프런티어 모델과 최적화 기법을 결합한 Kiro의 자동 라우터입니다. 작업마다 적절한 모델을 골라 최적의 품질 대비 비용을 제공합니다. Free 티어에서는 Claude Sonnet 4.5급 이상의 품질을, 유료 티어에서는 향상된 트래픽 라우팅과 함께 Claude Opus 4.6급 이상의 품질을 제공합니다. Auto는 결과가 개별 모델과 견주거나 그 이상이 되도록 높은 품질 기준을 유지합니다.

Claude Opus 4.8

Anthropic Opus 계열 중 가장 “정직한” 모델로, 직전 버전 대비 코드 결함을 그냥 넘어갈 확률이 약 4분의 1 수준이라고 알려져 있습니다. 근거가 약하면 사용자에게 되묻고, 같은 지능을 더 적은 단계로 풀어냅니다. 1M 컨텍스트와 128K 출력 한계를 갖습니다.

Claude Opus 4.7

작업 난이도에 따라 내부 추론량을 자동 조절하는 adaptive thinking이 도입됐습니다. 지시 사항 준수, 결과 검증, 스크린샷·다이어그램에 대한 비전 해상도(약 3배)가 모두 강화되었습니다.

Claude Opus 4.6

Terminal-Bench 2.0과 SWE-bench Verified에서 최상위권 점수를 기록한 모델로, 수백만 라인 규모의 코드베이스에서도 집중력을 유지하며 디버깅과 자가 수정에 강합니다.

Claude Opus 4.5

모호한 요구사항이나 트레이드오프를 다루는 데 능하고, 한 번에 정답을 내야 하는 단발 작업에서 신뢰도가 높습니다.

Claude Sonnet 5

Anthropic Sonnet 계열 중 가장 에이전틱한 모델입니다. 추론, 도구 사용, 코딩, 지식 작업에서 Sonnet급 가격대를 유지하면서 Opus 4.8에 근접한 성능을 보입니다. 편집에 앞서 계획을 세우고, 감독 없이 더 오래 실행하며, 요청하지 않아도 스스로 결과를 검증합니다. 이전 Sonnet 모델이 중도에 멈추던 복잡한 작업도 끝까지 완수한다는 평가가 많습니다. 광범위한 변경을 높은 완성도로 구현해야 하는 spec 기반 워크플로에 특히 잘 맞습니다.

Claude Sonnet 4.6 / 4.5 / 4.0

Sonnet 4.6은 Sonnet 4.5에서 한 단계 올라간 버전으로, 토큰 효율이 좋아 lead agent와 subagent 양쪽에 두루 적합합니다. Sonnet 4.5는 자율 작업이 가능한 수준의 에이전틱 코딩 성능을, Sonnet 4.0은 라우팅 계층 없이 일관된 결과가 필요한 워크플로에 적합합니다.

Claude Haiku 4.5

Anthropic의 가장 빠른 모델로, 추론·코딩 점수에서 Sonnet 4와 비슷하지만 두 배 이상 빠릅니다. Haiku 계열 최초로 extended thinking을 지원합니다.

오픈웨이트 모델

MiniMax M2.5 — 다양한 실제 환경에서 강화학습으로 훈련된 모델, 0.25x.
GLM-5 — 200K 컨텍스트의 sparse MoE 구조로 대형 리포 마이그레이션·리팩터링에 강함, 0.5x.
DeepSeek 3.2 — 긴 도구 호출 체인과 멀티스텝 추론에 강함, 0.25x.
MiniMax M2.1 — Rust, Go, C++, Kotlin, TypeScript 등 다국어 프로그래밍과 UI 생성에 강함, 0.15x.
Qwen3 Coder Next — 256K 컨텍스트, 오류 복구가 뛰어난 코딩 에이전트 특화 모델로 가장 저렴(0.05x).

모델별 차이점

계획 깊이: Opus는 사전 계획을 길게 세웁니다. Sonnet 5는 이 격차를 좁혀 편집 전에 계획을 세우고 결과를 자가 검증하지만, 가장 어려운 문제에서는 Opus가 여전히 더 깊이 파고듭니다.
Adaptive thinking(Opus 4.7+): 작업 난이도에 따라 추론량이 자동 조절됩니다.
자가 수정: Opus 4.7은 결과 검증, 4.8은 불확실성 자체를 적극적으로 표시합니다.
세션 지속력: Opus는 긴 세션에서 가장 집중력을 잘 유지합니다. Sonnet 5는 이전 Sonnet 모델보다 더 오래 자율적으로 실행되어 멀티스텝 에이전틱 작업에 강합니다.
이니셔티브: Opus는 더 넓게 움직입니다. Sonnet 5도 이전 Sonnet보다 이니셔티브가 커져 예전 버전이 멈추던 작업을 끝까지 완수하며, Sonnet 4.6 이하는 요청에 더 가깝게 머무릅니다.

Reasoning effort

모델이 프롬프트에 얼마나 많은 추론을 적용할지 조절할 수 있습니다. 낮은 effort 레벨은 더 빠르고 짧은 응답을 내고 크레딧을 덜 사용합니다. 높은 레벨은 더 깊은 분석, 멀티스텝 추론, 꼼꼼한 코드 생성에 더 많은 토큰을 씁니다.

IDE에서 effort 설정하기

채팅 입력창의 모델 이름을 클릭해 모델 셀렉터를 열고, 오른쪽의 Effort 패널에서 effort 레벨을 선택합니다.

레벨	동작
Low	빠르고 간결한 응답. 단순한 질문과 빠른 조회에 적합합니다.
Medium	균형 잡힌 추론. 대부분의 개발 작업에 적합합니다.
High	철저한 분석. 복잡한 리팩터링과 아키텍처 결정에 더 좋습니다.
XHigh	확장된 추론. 여러 파일 변경과 미묘한 문제에 유용합니다.
Max	최대 깊이. 어려운 디버깅, 보안 분석, 복잡한 로직에 가장 좋습니다.

선택한 effort는 모델 이름 옆에 표시되며(예: "Claude Opus 4.6 · Max"), 해당 대화에서 이후 보내는 모든 메시지에 적용됩니다.

피커에는 현재 모델에서 사용할 수 있는 레벨만 표시됩니다.

모델	사용 가능한 레벨
Claude Opus 4.8	Low, Medium, High, XHigh, Max
Claude Opus 4.7	Low, Medium, High, XHigh, Max
Claude Opus 4.6	Low, Medium, High, Max
Claude Sonnet 4.6	Low, Medium, High, Max

effort를 조절해야 할 때

올릴 때: 에이전트가 얕은 답을 내거나, 엣지 케이스를 놓치거나, 미완성 구현을 내놓을 때.
내릴 때: 빠른 답이 필요하고 확장된 추론을 기다리고 싶지 않을 때.
가장 높은 레벨을 쓸 때: 보안 검토, 복잡한 디버깅 세션, 또는 상호작용하는 제약 조건을 다수 고려해야 할 때.

참고: 높은 effort 레벨은 내부적으로 더 많은 토큰을 사용하므로, 같은 크레딧 배수라도 상호작용당 크레딧 소비가 늘어납니다. 이것이 배수가 동일한 두 모델이 같은 작업에서 서로 다른 크레딧 비용을 내는 이유 중 하나입니다.

모델 라이프사이클

Experimental — 초기 단계로 동작이 변경될 수 있고, 사용 가능한 리전이 제한됩니다. 모델 셀렉터에 별도 표시됩니다.
Active — 운영 환경에서 사용 권장, 모든 지원 리전에서 제공.

Experimental 모델의 추론은 가용성과 성능을 위해 여러 AWS Region에 걸쳐 처리될 수 있습니다. 데이터 보호 관련 문서에서 cross-region inference 정책을 함께 확인하세요.

출시일

모델	출시일	상태
Claude Sonnet 5	2026-06-30	Experimental
Claude Opus 4.8	2026-05-28	Active
Claude Opus 4.7	2026-04-16	Active
GLM-5	2026-03-31	Experimental
MiniMax M2.5	2026-03-18	Experimental
Claude Sonnet 4.6	2026-02-17	Active
DeepSeek 3.2	2026-02-10	Experimental
MiniMax M2.1	2026-02-10	Experimental
Qwen3 Coder Next	2026-02-10	Experimental
Claude Opus 4.6	2026-02-05	Active
Claude Opus 4.5	2025-11-24	Active
Claude Sonnet 4.5	2025-09-29	Active
Auto	2025-09-17	Active
Claude Sonnet 4.0	2025-09-04	Active
Claude Haiku 4.5	2025-09-04	Active

모범 사례

대부분의 작업은 Auto로 시작합니다.
까다로운 문제나 여러 파일에 걸친 장기 작업에서는 Opus로 올립니다.
Opus보다 낮은 비용으로 강력한 에이전틱 동작을 원할 때, 특히 끝까지 실행돼야 하는 멀티스텝 작업에는 Sonnet 5를 사용합니다.
간단한 수정이나 크레딧 절약이 필요할 땐 Haiku를 사용합니다.
계정 설정에서 사용량을 주기적으로 확인합니다.
Opus를 자주 쓴다면 Pro+나 Power 티어를 검토합니다.