AI Life

계약서엔 DeepL, 이메일엔 구글, ChatGPT는 검토 후 써라

navi

AI Life Desk

Published 2026. 04. 09. 오전 11:04 KST

The Lead

DeepL·ChatGPT·Google 번역은 각각 다른 방식으로 실패한다. 문서 종류에 따라 번역기를 골라야 실수를 줄인다.

번역기 3종을 실제 문서 50개로 테스트한 결과, 어느 하나가 '가장 좋다'는 답은 없었다. 틀리는 방식이 달랐다. 어떤 문서에 어느 번역기를 쓰느냐가 실수와 손실의 차이를 만든다.

세 번역기가 각각 어디서 무너지는가

50개 문서 테스트에서 드러난 실패 패턴은 도구마다 달랐다.

  • DeepL: 유럽어 번역 정확도 약 78% 수준. 유럽어끼리는 강하지만 한국어 문서에서 같은 수준이 나온다는 보장은 없다. 한국어 결과는 별도 확인이 필요하다.
  • ChatGPT: 기술 용어에서 '환각(hallucination)' 사례가 발생했다. 원문에 없는 내용을 만들어낼 수 있다는 뜻이다. 번역 결과를 검토 없이 그대로 제출하면 계약서·기술 문서에서 실제 오류로 이어진다.
  • Google Translate: 249개 언어를 지원해 언어 폭이 가장 넓다. 일반 이메일·간단한 문서에선 빠르고 충분하지만, 전문 용어가 많은 문서에선 맥락을 놓치는 경우가 있다.

문서 유형에 따라 번역기를 골라야 하는 이유

세 도구 중 '가장 위험한' 번역기는 문서 종류에 따라 달라진다.

  1. 계약서·법률 문서: ChatGPT 단독 사용은 피한다. 없는 조항이 생성될 수 있다. DeepL 초안 + 전문가 검토 조합이 현실적이다.
  2. 기술 문서·특허: ChatGPT 환각 위험이 가장 크다. 전문 용어가 틀리면 의미 자체가 뒤집힌다. DeepL이 상대적으로 안전하나 한국어 기준 성능은 확인 필요.
  3. 일반 업무 이메일·공지: Google Translate 무료로 충분. 속도와 편의성이 우선이다.

단, 이 테스트는 문서 50개 기준이다. 표본이 크지 않고 문서 유형 구성도 공개되지 않았다. 자신이 자주 다루는 문서 유형으로 직접 비교해보는 것이 가장 정확하다.

오늘 내 문서 유형을 확인하고 번역기를 정하자

지금 가장 자주 번역하는 문서 종류가 뭔지 떠올려보자. 계약서·기술 문서라면 ChatGPT 단독 사용 전에 DeepL(deepl.com) 결과와 나란히 비교해보자. 일반 이메일이라면 Google Translate 무료로 시작해도 충분하다.

0
💬0

Public Discussion

토론