AI API 비용 계산법 — GPT·Claude·Gemini 토큰 요금 한눈에 비교
AI API 비용 계산법 — GPT·Claude·Gemini 토큰 요금 한눈에 비교
AI를 서비스에 붙이려고 API 요금표를 열어 본 순간, "토큰? 1M당? 입력이랑 출력이 따로?"라며 막막했던 경험이 있을 겁니다. AI API 비용은 구조만 이해하면 의외로 단순합니다. 이 글에서는 요금 구조와 모델별 차이, 그리고 실제 비용을 줄이는 방법을 정리합니다. 본문 아래에 토큰 수만 넣으면 즉시 계산되는 무료 AI API 비용 계산기도 연결해 두었습니다.
AI API 요금은 '토큰' 단위로 매겨진다
거의 모든 LLM API는 토큰(token) 단위로 과금합니다. 토큰은 단어보다 작은 텍스트 조각으로, 영어는 대략 1단어 ≈ 1.3토큰, 한국어는 글자당 토큰이 더 많이 잡히는 경향이 있습니다(대략 1글자 ≈ 1.5~2토큰).
핵심은 입력 토큰과 출력 토큰의 단가가 다르다는 점입니다.
- 입력 토큰(input): 모델에게 보낸 프롬프트·문맥의 양
- 출력 토큰(output): 모델이 생성한 답변의 양
대부분의 모델에서 출력 단가가 입력보다 3~5배 비쌉니다. 따라서 긴 답변을 많이 생성하는 서비스일수록 비용이 빠르게 늘어납니다.
비용 계산 공식
비용은 단순한 곱셈입니다.
비용(USD) = (입력 토큰 ÷ 1,000,000 × 입력 단가)
+ (출력 토큰 ÷ 1,000,000 × 출력 단가)
예를 들어 입력 단가 $3/1M, 출력 단가 $15/1M인 모델에 입력 100만 토큰·출력 50만 토큰을 쓰면:
= (1,000,000 ÷ 1,000,000 × 3) + (500,000 ÷ 1,000,000 × 15)
= 3 + 7.5 = $10.5
모델별 비용 차이 — 성능과 가격의 균형
같은 작업도 어떤 모델을 쓰느냐에 따라 비용이 수십 배 차이 납니다. 일반적으로:
- 고성능 모델(예: Claude Opus 4.8, GPT-5.5 계열): 복잡한 추론·코드·긴 문서에 강하지만 단가가 높음
- 경량 모델(예: GPT-5.4 mini, Gemini Flash, Claude Haiku): 분류·요약·간단한 응답에 충분하고 단가가 매우 저렴
실무 팁은 작업 난이도에 따라 모델을 나누는 것입니다. 간단한 분류·추출은 경량 모델로, 복잡한 추론만 고성능 모델로 라우팅하면 품질을 유지하면서 비용을 크게 줄일 수 있습니다.
실제 청구액을 줄이는 5가지 방법
- 프롬프트를 짧게: 불필요한 예시·반복 문맥을 줄이면 입력 토큰이 직접 절감됩니다.
- 출력 길이 제한:
max_tokens를 적절히 걸어 과도하게 긴 답변을 막습니다(출력 단가가 비싸기 때문에 효과가 큼). - 경량 모델 우선: 대부분의 일상 작업은 경량 모델로 충분합니다.
- 캐싱 활용: 동일한 시스템 프롬프트·문맥을 반복한다면 프롬프트 캐싱으로 입력 비용을 줄일 수 있습니다.
- 배치 처리: 실시간이 필요 없는 작업은 배치 API(있는 경우)로 할인 단가를 적용합니다.
무료 계산기로 바로 추산해 보세요
모델과 입력·출력 토큰 수만 넣으면 1회 호출 기준 예상 비용을 USD와 원화로 보여주고, 동일 토큰 기준 여러 모델을 한 번에 비교해 줍니다.
참고: 모델 단가는 각 제공사 정책에 따라 수시로 바뀝니다. 계산기의 단가는 공식 가격표 기준의 참고치이며, 정확한 청구액은 제공사의 최신 가격·할인·배치 정책을 확인하세요.