한국어는 영어보다 토큰을 더 쓴다 — AI 비용 줄이는 프롬프트 작성법
한국어는 영어보다 토큰을 더 쓴다 — AI 비용 줄이는 프롬프트 작성법
한국어로 AI를 쓰면 영어로 쓸 때보다 비용이 더 나온다는 사실, 알고 계셨나요? 같은 내용을 전달해도 한국어는 토큰을 더 많이 소모합니다. 왜 그런지, 그리고 어떻게 줄이는지 알아봅니다.
왜 한국어가 토큰을 더 쓸까
토큰은 모델이 텍스트를 처리하는 최소 단위입니다. 대략적인 경험칙은:
- 영어: 1토큰 ≈ 4자 (0.25토큰/자)
- 한국어: 1자 ≈ 1.5토큰
영어 토크나이저는 영어 데이터로 최적화되어 단어·접두사 단위로 효율적으로 쪼갭니다. 반면 한국어는 조사·어미가 붙는 교착어 특성상 음절이 더 잘게 나뉘어 글자당 토큰 소모가 영어의 5~6배에 이릅니다. 결과적으로 "안녕하세요"(5자)가 영어 "Hello"(5자)보다 훨씬 많은 토큰이 됩니다.
비용으로 환산하면
입력 단가 $3/100만 토큰인 모델에 1,000자 분량을 보낸다고 가정하면:
- 영어 1,000자 ≈ 250토큰 → $0.00075
- 한국어 1,000자 ≈ 1,500토큰 → $0.0045
같은 글자 수라면 한국어가 약 6배 비쌉니다. (다만 한국어는 같은 의미를 더 적은 글자로 표현하므로 체감 차이는 이보다 작습니다.) 하루 수천 건을 처리하는 서비스라면 이 차이가 월 수십만 원으로 벌어집니다.
토큰을 줄이는 프롬프트 기법
1. 군더더기 제거
"에 대해서 자세하게 설명을 좀 해주실 수 있을까요?" → " 설명." 정중한 표현은 토큰만 늘릴 뿐 답변 품질과 무관합니다.
2. 반복 문맥은 캐싱으로
매 요청에 같은 시스템 프롬프트·예시를 넣고 있다면, 프롬프트 캐싱으로 입력 비용을 최대 90%까지 줄일 수 있습니다.
3. 출력 언어·길이 지정
"3줄 이내로", "표로만" 같은 제약은 출력 토큰을 직접 줄입니다. 출력 단가가 입력보다 비싸므로 효과가 큽니다.
4. 긴 문서는 영어 요약 후 처리
대용량 영어 문서를 다룰 때 굳이 한국어로 번역해 넣으면 토큰이 불어납니다. 원문(영어)으로 처리하고 결과만 한국어로 받는 게 쌉니다.
내 프롬프트가 몇 토큰인지 확인
텍스트를 붙여넣으면 예상 토큰 수와 모델별 입력 비용을 추정합니다.
전체 호출 비용(입력+출력)은 **AI API 비용 계산기**에서 계산하세요.
토큰 수는 경험칙 추정으로 모델 토크나이저(cl100k·o200k 등)에 따라 ±30% 오차가 있을 수 있습니다.