AI Life

DeepL·구글·ChatGPT, 번역 도구마다 틀리는 방식이 다르다

navi

AI Life Desk

Published 2026. 04. 09. 오전 03:02 KST

The Lead

번역 도구는 '어느 게 좋다'보다 '어디서 어떻게 틀리는지'가 다르다. 유럽어는 DeepL, 희귀 언어는 구글, ChatGPT 기술 문서는 반드시 검토.

번역 도구 3종을 실제 문서 50개에 테스트했더니 정확도 순위보다 중요한 게 드러났다. 어디서 잘하는지가 아니라 어디서 어떻게 틀리는지가 달랐다. 도구를 하나만 쓰다가 중요한 실수를 낼 수 있는 이유다.

도구마다 실패하는 지점이 다르다

이 테스트에서 확인된 각 도구의 실패 패턴은 이렇게 나뉜다.

  • DeepL: 영어·독일어·프랑스어 등 유럽어 문서에서 약 78% 게재 수준의 정확도. 하지만 이 수치는 유럽어 기준이다. 한국어 번역 성능은 이 테스트에 포함되지 않았다.
  • ChatGPT: 기술 용어가 포함된 문서에서 환각(hallucination) 사례 발생 확인. 없는 용어나 잘못된 전문 표현을 그럴듯하게 생성하는 오류다. 계약서·특허·의학 문서처럼 용어 하나가 치명적인 문서에서는 반드시 결과를 검토해야 한다.
  • Google Translate: 249개 언어를 지원해 커버리지가 가장 넓다. 아랍어·스와힐리어·몽골어처럼 DeepL이 지원하지 않는 언어가 필요할 때 선택지가 여기밖에 없다.

상황별로 고르는 기준

정확도 순위를 외우는 것보다 '내 문서가 어떤 유형인지'를 먼저 따지는 게 실용적이다.

  1. 영어·유럽어 계약서·공문서: DeepL 우선. 문체가 자연스럽고 유럽어 쌍에서 테스트 검증 정확도가 가장 높았다.
  2. 기술 전문 용어 포함 문서: ChatGPT를 쓰더라도 결과를 반드시 원문과 대조 검토할 것. 환각 오류는 눈에 잘 안 띄는 형태로 나온다.
  3. 희귀 언어·다국어 동시 처리: Google Translate. 249개 언어 지원이라는 폭은 다른 도구가 따라가지 못한다.
  4. 한국어 번역 성능: 이번 테스트에 한국어가 포함되지 않았다. 한국어 문서를 번역하거나 한국어로 번역받을 때는 각 도구를 직접 비교해보는 것이 가장 정확하다.

세 도구 모두 무료로 시작할 수 있다. DeepL은 월 번역 분량 제한이 있고, 유료 플랜(DeepL Pro)은 월 약 10달러 수준부터 시작한다. 구글 번역과 ChatGPT(기본 모델)는 무료로 사용 가능하다.

지금 바로 비교해보자

최근에 번역했던 문서에서 문단 하나를 복사해 DeepL(deepl.com), 구글 번역(translate.google.com), ChatGPT에 같은 텍스트를 붙여넣어라. 세 결과를 나란히 놓으면 어디서 다르게 번역되는지 바로 보인다. 기술 용어가 있는 단락이라면 ChatGPT 결과를 원문과 특히 주의 깊게 대조하라.

0
💬0

Public Discussion

토론