유저 늘수록 적자 나는 AI SaaS, API 비용 85% 줄인 1인 창업자의 구조 재설계
forge
AI Success Desk
The Lead
유저 증가와 함께 Claude API 비용이 폭증한 1인 창업자가 코스트 구조를 재설계해 85% 절감, 실시간 성능은 유지했다. AI SaaS 출시 전 반드시 확인해야 할 역마진 함정의 실전 사례.
세일즈 콜 분류 AI 툴을 출시한 1인 창업자가 유저가 늘수록 Claude API 비용이 폭증하는 역마진 구조에 부딪혔다. 코스트 구조를 재설계한 뒤 비용을 85% 줄이면서도 실시간 성능을 유지했다. 성장이 곧 손실이 되는 AI SaaS의 구조적 함정을 먼저 맞닥뜨린 사례다.
유저가 늘수록 왜 돈을 잃는가
이 창업자가 만든 것은 세일즈 콜을 실시간으로 분류·검증하는 AI 툴이다. 출시 초기에는 비용이 감당할 만했다. 문제는 유저가 늘면서 시작됐다. Claude API 호출이 유저 수에 비례해 — 또는 그 이상으로 — 증가하면서 매출보다 비용이 빠르게 불어났다.
이것이 AI SaaS의 구조적 함정이다. 일반 SaaS는 유저가 늘어도 서버 비용이 완만하게 올라가지만, AI API 기반 서비스는 호출 한 번에 토큰 비용이 붙는다. 유저당 호출 횟수를 통제하지 않으면 스케일 자체가 리스크가 된다. 지금 AI 툴을 만들고 있다면, 유저 100명일 때 월 API 비용이 얼마인지 지금 당장 추산해야 한다.
85% 절감, 어떻게 가능했나
이 창업자는 코스트 구조 자체를 재설계했다. 소스에서 공개된 핵심은 두 가지다. 실시간 성능을 포기하지 않으면서 비용을 줄이는 것이 가능하다는 것, 그리고 그 방법이 아키텍처 수준의 변경이었다는 것이다. 재설계 전후 비용 차이는 85%다.
구체적인 기법은 소스 원문(Reddit 게시글)에서 직접 확인할 수 있다. 중요한 것은 결과가 아니라 접근 방식의 순서다.
- 유저당 API 호출 횟수를 먼저 측정한다
- 어떤 호출이 반복되거나 불필요한지 찾는다
- 성능을 유지하면서 줄일 수 있는 구조를 찾는다
비용 절감이 목표가 아니라, 수익 구조가 작동하는 구조를 만드는 것이 목표다. 절감된 85%가 매출 구조와 연결되지 않으면 의미가 없다.
한국에서 AI SaaS를 준비한다면
한국에서 Claude API 또는 OpenAI API 기반 서비스를 만들 때도 이 함정은 동일하게 작동한다. 초기에 Notion AI, ChatGPT 래퍼처럼 빠르게 출시하는 것은 쉽지만, 유저 수십 명 단계에서 API 비용이 예상을 초과하는 경우가 반복되고 있다.
국내 결제 환경(토스페이먼츠, 포트원 등)을 붙이기 전에 유저 1명당 월 API 비용을 먼저 계산하라. 구독 단가보다 API 비용이 높으면 유저가 늘수록 손실이 커진다. 이 계산을 MVP 단계에서 하지 않으면, 이 창업자처럼 출시 후에 구조를 뜯어고쳐야 한다.
지금 만들고 있는 AI 툴의 손익분기 유저 수를 계산해보자
Claude API 또는 OpenAI API 가격 페이지에서 토큰당 단가를 확인하라. 유저 1명이 하루에 몇 번 기능을 쓰는지 추산하고, 한 번 호출에 평균 몇 토큰이 드는지 곱하라. 월 기준으로 유저 10명, 100명, 1000명일 때 API 비용이 얼마인지 스프레드시트에 적어라. 계획 중인 구독 단가와 비교해 손익분기 유저 수를 구하라. 이 숫자가 없으면 출시 후 이 창업자와 같은 구조를 밟게 된다.