인텔·삼바노바, AI 추론 단계 분리로 엔비디아 대안 선언

인텔과 삼바노바가 4월 8일 AI 추론을 두 단계로 나누는 이기종 플랫폼을 공동 공개했다. 엔비디아 단일 GPU 구조 대신, 프리필은 GPU·가속기가, 디코드는 삼바노바 SN50 RDU가 맡는 역할 분리 방식이다.

프리필과 디코드, 왜 나눠야 하나

기존 AI 추론은 엔비디아 GPU 하나로 프리필(긴 프롬프트 처리·데이터 준비)과 디코드(실제 토큰 생성) 두 단계를 모두 처리한다. 인텔·삼바노바의 접근은 다르다. 각 단계에 최적화된 하드웨어를 따로 배치해 전체 추론 비용과 효율을 개선하겠다는 구조다.

프리필 단계에는 GPU나 인텔 AI 가속기가, 디코드 단계에는 삼바노바의 SN50 RDU가 투입된다. 두 회사가 각자 강점을 가진 구간을 맡는 분업 모델이다.

한국 기업에 실질적 영향은 언제부터

이번 발표는 기업용(B2B) AI 추론 시장을 겨냥한다. 엔비디아 GPU 의존도와 비용을 낮추려는 국내 클라우드·대기업 AI 인프라 담당자라면 주목할 만한 방향이다. 다만 공식 발표문에 구체적인 비용·성능 수치는 아직 공개되지 않았다. 한국 기업 도입 시점도 미정이다.

수치 공개 여부를 먼저 확인하라

SambaNova SN50 RDU 공식 스펙 페이지와 인텔 발표문에서 비용·성능 비교 수치가 공개됐는지 확인. 구체적 숫자 없으면 관망이 맞다.

인텔·삼바노바, AI 추론 단계 분리로 엔비디아 대안 선언

The Lead

프리필과 디코드, 왜 나눠야 하나

한국 기업에 실질적 영향은 언제부터

수치 공개 여부를 먼저 확인하라

Public Discussion

토론