GPT·Claude·Gemini API 요금 총정리 (2026) — 9개 모델 실측 단가표
GPT·Claude·Gemini API 요금 총정리 (2026) — 9개 모델 실측 단가표
AI API를 도입할 때 가장 헷갈리는 건 "모델이 너무 많고 가격 체계가 제각각"이라는 점입니다. 이 글은 OpenAI·Anthropic·Google의 주요 9개 모델 단가를 2026년 공식 가격 기준 한 표로 정리하고, 작업 유형별로 가장 경제적인 선택을 안내합니다.
9개 모델 입력·출력 단가 (100만 토큰당, USD)
| 모델 | 제공사 | 입력 | 출력 |
|---|---|---|---|
| Claude Opus 4.8 | Anthropic | $5 | $25 |
| Claude Sonnet 4.6 | Anthropic | $3 | $15 |
| Claude Haiku 4.5 | Anthropic | $1 | $5 |
| GPT-5.5 | OpenAI | $5 | $30 |
| GPT-5.4 | OpenAI | $2.5 | $15 |
| GPT-5.4 mini | OpenAI | $0.75 | $4.5 |
| Gemini 3.1 Pro | $2 | $12 | |
| Gemini 2.5 Flash | $0.3 | $2.5 | |
| Gemini 3.1 Flash-Lite | $0.25 | $1.5 |
표준(standard) 단가 기준이며 캐싱·배치 할인은 제외했습니다. 단가는 각 사 정책에 따라 수시 변동되므로 도입 전 공식 페이지를 확인하세요.
출력 단가가 비용을 좌우한다
표를 보면 출력 단가가 입력의 3~6배입니다. 예를 들어 GPT-5.5는 입력 $5, 출력 $30으로 6배 차이입니다. 즉 같은 모델이라도 답변을 길게 생성하는 서비스일수록 비용이 급증합니다. 비용을 줄이려면 출력 길이(max_tokens) 관리가 입력 프롬프트 단축보다 효과가 큽니다.
작업 유형별 경제적인 모델
1. 대량 분류·태깅·요약 → 경량 모델
단순 반복 작업에 고성능 모델은 과합니다. Gemini 3.1 Flash-Lite($0.25/$1.5), GPT-5.4 mini($0.75/$4.5), **Claude Haiku 4.5($1/$5)**가 압도적으로 저렴합니다. 100만 입력+100만 출력 기준 Flash-Lite는 $1.75, Opus 4.8($30)의 1/17 수준입니다.
2. 일반 production(챗봇·콘텐츠) → 중급 모델
품질과 비용의 균형점은 Claude Sonnet 4.6($3/$15), GPT-5.4($2.5/$15), **Gemini 3.1 Pro($2/$12)**입니다. 대부분의 실서비스는 이 구간으로 충분합니다.
3. 복잡한 추론·코드·긴 문서 → 플래그십
정확도가 매출과 직결되는 작업은 Claude Opus 4.8($5/$25), **GPT-5.5($5/$30)**가 적합합니다. 단가는 높지만 재작업·오류 비용을 줄여 총비용은 더 낮아질 수 있습니다.
실전 팁: 모델 라우팅
가장 효과적인 비용 절감은 작업 난이도에 따라 모델을 나누는 것입니다. 간단한 요청은 경량 모델로, 복잡한 추론만 플래그십으로 보내면 품질을 유지하면서 비용을 절반 이하로 줄일 수 있습니다.
내 사용량으로 직접 계산
위 단가를 내 월 사용량에 대입해 보세요.
- 요청별 1회 비용: AI API 비용 계산기
- 월 사용량 기준 모델별 비교: 요금 비교기