Models

Kiro에서 사용할 수 있는 AI 모델 라인업과 작업 성격에 맞춰 모델을 고르는 방법을 정리합니다.

개요

Kiro는 정밀도가 중요한 아키텍처 작업에 적합한 프런티어급 모델부터, 길게 이어지는 코딩 세션에서 부담을 줄여 주는 경량 오픈웨이트 모델까지 폭넓게 제공합니다. 채팅 입력창의 모델 드롭다운에서 직접 선택할 수도 있고, Auto를 사용하면 Kiro가 작업 성격에 따라 적합한 모델을 자동으로 라우팅합니다.

모델 비교표

비용 배수는 Auto를 1.0x 기준으로 한 상대 값입니다. 예를 들어 Auto에서 10크레딧이 드는 작업은 Opus에서는 22, Haiku에서는 4, Qwen3 Coder Next에서는 0.5 수준에서 처리됩니다.

모델컨텍스트비용 배수리전이용 가능 티어
Claude Opus 4.81M2.2xus-east-1, eu-central-1Pro, Pro+, Power
Claude Opus 4.71M2.2xus-east-1, eu-central-1Pro, Pro+, Power
Claude Opus 4.61M2.2xus-east-1, eu-central-1Pro, Pro+, Power
Claude Opus 4.5200K2.2xus-east-1, eu-central-1Pro, Pro+, Power
Claude Sonnet 4.61M1.3xus-east-1, eu-central-1Pro, Pro+, Power
Claude Sonnet 4.5200K1.3xus-east-1, eu-central-1Free, Pro, Pro+, Power
Claude Sonnet 4.0200K1.3xus-east-1, eu-central-1Free, Pro, Pro+, Power
Auto1.0xus-east-1, eu-central-1Free, Pro, Pro+, Power
Claude Haiku 4.5200K0.4xus-east-1, eu-central-1Pro, Pro+, Power
GLM-5200K0.5xus-east-1Free, Pro, Pro+, Power
DeepSeek 3.2128K0.25xus-east-1Free, Pro, Pro+, Power
MiniMax M2.5200K0.25xus-east-1, eu-central-1Free, Pro, Pro+, Power
MiniMax M2.1200K0.15xus-east-1, eu-central-1Free, Pro, Pro+, Power
Qwen3 Coder Next256K0.05xus-east-1, eu-central-1Free, Pro, Pro+, Power

모델 전환 방법

  1. 채팅 패널 하단의 모델 드롭다운을 엽니다.
  2. 원하는 모델을 선택합니다.
  3. 해당 대화에서 이후 보내는 모든 메시지에 선택이 반영됩니다.
대화 도중 모델을 바꿔도 지금까지의 컨텍스트는 유지되므로, 까다로운 단계에서만 잠시 Opus로 올렸다가 다시 Sonnet으로 내려도 됩니다.

상황별 추천

주요 모델 특징

Auto (권장)

여러 프런티어 모델과 최적화 기법을 결합한 Kiro의 자동 라우터입니다. 작업마다 적절한 모델을 골라 평균적으로 Sonnet 4 수준의 품질을 제공합니다.

Claude Opus 4.8

Anthropic Opus 계열 중 가장 “정직한” 모델로, 직전 버전 대비 코드 결함을 그냥 넘어갈 확률이 약 4분의 1 수준이라고 알려져 있습니다. 근거가 약하면 사용자에게 되묻고, 같은 지능을 더 적은 단계로 풀어냅니다. 1M 컨텍스트와 128K 출력 한계를 갖습니다.

Claude Opus 4.7

작업 난이도에 따라 내부 추론량을 자동 조절하는 adaptive thinking이 도입됐습니다. 지시 사항 준수, 결과 검증, 스크린샷·다이어그램에 대한 비전 해상도(약 3배)가 모두 강화되었습니다.

Claude Opus 4.6

Terminal-Bench 2.0과 SWE-bench Verified에서 최상위권 점수를 기록한 모델로, 수백만 라인 규모의 코드베이스에서도 집중력을 유지하며 디버깅과 자가 수정에 강합니다.

Claude Opus 4.5

모호한 요구사항이나 트레이드오프를 다루는 데 능하고, 한 번에 정답을 내야 하는 단발 작업에서 신뢰도가 높습니다.

Claude Sonnet 4.6 / 4.5 / 4.0

Sonnet 4.6은 Sonnet 4.5에서 한 단계 올라간 버전으로, 토큰 효율이 좋아 lead agent와 subagent 양쪽에 두루 적합합니다. Sonnet 4.5는 자율 작업이 가능한 수준의 에이전틱 코딩 성능을, Sonnet 4.0은 라우팅 계층 없이 일관된 결과가 필요한 워크플로에 적합합니다.

Claude Haiku 4.5

Anthropic의 가장 빠른 모델로, 추론·코딩 점수에서 Sonnet 4와 비슷하지만 두 배 이상 빠릅니다. Haiku 계열 최초로 extended thinking을 지원합니다.

오픈웨이트 모델

모델별 차이점

모델 라이프사이클

Experimental 모델의 추론은 가용성과 성능을 위해 여러 AWS Region에 걸쳐 처리될 수 있습니다. 데이터 보호 관련 문서에서 cross-region inference 정책을 함께 확인하세요.

모범 사례

  1. 대부분의 작업은 Auto로 시작합니다.
  2. 까다로운 문제나 여러 파일에 걸친 장기 작업에서는 Opus로 올립니다.
  3. 간단한 수정이나 크레딧 절약이 필요할 땐 Haiku를 사용합니다.
  4. 계정 설정에서 사용량을 주기적으로 확인합니다.
  5. Opus를 자주 쓴다면 Pro+Power 티어를 검토합니다.