AI Life

DeepL·ChatGPT·구글 번역, 각각 어디서 틀리는가

navi

AI Life Desk

Published 2026. 04. 09. 오전 10:32 KST

The Lead

번역 도구 3종은 실수 방식이 다르다. ChatGPT는 환각, DeepL은 한국어 검증 미비, 구글 번역은 자연어 어색함. 문서 유형에 따라 위험 도구가 달라진다.

번역 도구 3종은 실수하는 방식이 다르다. 실문서 50개 테스트 결과, DeepL은 유럽어 기준 약 78% 정확도를 보였고, ChatGPT는 없는 내용을 만들어내는 환각 오류가 발생했으며, 구글 번역은 자연스러운 한국어 표현에서 어색함이 남았다. '어느 게 좋냐'는 질문보다 '어떤 문서를 번역하느냐'가 먼저다.

도구마다 실수하는 지점이 다르다

세 도구의 실패 패턴은 각기 다른 방향으로 나타난다.

  • DeepL — 유럽어·영어 번역에서 가장 안정적이지만, 한국어 기술 문서에서는 검증된 수치가 별도로 없다. 영문 계약서나 마케팅 문서처럼 유럽어 기반 자료에 강하다.
  • ChatGPT — 기술 용어나 전문 용어가 나오면 없는 내용을 그럴듯하게 만들어 채우는 환각(hallucination)이 발생한다. 번역 결과가 자연스러워 보여도 원문에 없는 단어가 섞여 있을 수 있다. 계약서·법률 문서·기술 매뉴얼에는 그대로 쓰지 말 것.
  • 구글 번역 — 249개 언어를 지원해 언어 폭이 가장 넓다. 짧은 문장이나 일상 표현은 빠르고 무난하지만, 긴 문장이나 한국어 경어체는 어색하게 출력되는 경우가 있다.

세 도구 모두 '이상 없어 보이는' 결과를 내놓는다. 그게 문제다. 오류가 눈에 띄지 않을 때 그냥 넘기면 문서 전체가 오염된다.

어떤 문서에 어떤 도구를 써야 하나

문서 유형별로 위험 도구가 달라진다.

  • 영문 계약서·제안서 → DeepL 초안, 핵심 조항은 반드시 사람이 재검토
  • 이메일·짧은 안내문 → 구글 번역으로 충분. 유료 구독 불필요
  • 기술 문서·매뉴얼·사양서 → ChatGPT 단독 사용 주의. 전문 용어 환각 리스크가 높다. DeepL + 사람 검수 병행 권장
  • 동남아·중동·아프리카 언어 포함 문서 → 구글 번역이 유일한 선택지인 경우가 많다

한국어 번역 품질은 세 도구 모두 독립적인 한국어 성능 수치가 공개되어 있지 않다. 중요한 문서라면 한 문단이라도 세 도구 결과를 나란히 놓고 비교하는 것이 가장 현실적인 검증 방법이다.

지금 바로 확인해보기

오늘 번역한 문서에서 전문 용어나 숫자가 포함된 단락 하나를 골라라. DeepL(deepl.com), ChatGPT(chat.openai.com), 구글 번역(translate.google.com) 세 곳에 동시에 넣고, 결과가 서로 다른 단어나 문장을 찾아라. 다른 부분이 곧 오류 후보다.

0
💬0

Public Discussion

토론