DeepL·ChatGPT·구글 번역, 각각 어디서 틀리는가

번역 도구 3종은 실수하는 방식이 다르다. 실문서 50개 테스트 결과, DeepL은 유럽어 기준 약 78% 정확도를 보였고, ChatGPT는 없는 내용을 만들어내는 환각 오류가 발생했으며, 구글 번역은 자연스러운 한국어 표현에서 어색함이 남았다. '어느 게 좋냐'는 질문보다 '어떤 문서를 번역하느냐'가 먼저다.

도구마다 실수하는 지점이 다르다

세 도구의 실패 패턴은 각기 다른 방향으로 나타난다.

DeepL — 유럽어·영어 번역에서 가장 안정적이지만, 한국어 기술 문서에서는 검증된 수치가 별도로 없다. 영문 계약서나 마케팅 문서처럼 유럽어 기반 자료에 강하다.
ChatGPT — 기술 용어나 전문 용어가 나오면 없는 내용을 그럴듯하게 만들어 채우는 환각(hallucination)이 발생한다. 번역 결과가 자연스러워 보여도 원문에 없는 단어가 섞여 있을 수 있다. 계약서·법률 문서·기술 매뉴얼에는 그대로 쓰지 말 것.
구글 번역 — 249개 언어를 지원해 언어 폭이 가장 넓다. 짧은 문장이나 일상 표현은 빠르고 무난하지만, 긴 문장이나 한국어 경어체는 어색하게 출력되는 경우가 있다.

세 도구 모두 '이상 없어 보이는' 결과를 내놓는다. 그게 문제다. 오류가 눈에 띄지 않을 때 그냥 넘기면 문서 전체가 오염된다.

어떤 문서에 어떤 도구를 써야 하나

문서 유형별로 위험 도구가 달라진다.

영문 계약서·제안서 → DeepL 초안, 핵심 조항은 반드시 사람이 재검토
이메일·짧은 안내문 → 구글 번역으로 충분. 유료 구독 불필요
기술 문서·매뉴얼·사양서 → ChatGPT 단독 사용 주의. 전문 용어 환각 리스크가 높다. DeepL + 사람 검수 병행 권장
동남아·중동·아프리카 언어 포함 문서 → 구글 번역이 유일한 선택지인 경우가 많다

한국어 번역 품질은 세 도구 모두 독립적인 한국어 성능 수치가 공개되어 있지 않다. 중요한 문서라면 한 문단이라도 세 도구 결과를 나란히 놓고 비교하는 것이 가장 현실적인 검증 방법이다.

지금 바로 확인해보기

오늘 번역한 문서에서 전문 용어나 숫자가 포함된 단락 하나를 골라라. DeepL(deepl.com), ChatGPT(chat.openai.com), 구글 번역(translate.google.com) 세 곳에 동시에 넣고, 결과가 서로 다른 단어나 문장을 찾아라. 다른 부분이 곧 오류 후보다.

DeepL·ChatGPT·구글 번역, 각각 어디서 틀리는가

The Lead

도구마다 실수하는 지점이 다르다

어떤 문서에 어떤 도구를 써야 하나

지금 바로 확인해보기

Public Discussion

토론