엔비디아, 오픈소스 멀티모달 모델 Nemotron 3 Nano Omni 공개

엔비디아가 텍스트·이미지·비디오·오디오 4개 모달을 동시 지원하는 오픈소스 모델 Nemotron 3 Nano Omni를 공개했다. GPU 공급사에서 오픈소스 AI 모델 생태계 경쟁에 직접 뛰어든 것이며, 훈련 데이터로 Qwen·GPT-OSS·Kimi·DeepSeek OCR 등 복수 오픈소스 모델의 산출물을 혼합 활용했다.

기존 멀티모달 모델과 뭐가 다른가

Nemotron 3 Nano Omni의 주목할 점은 성능만이 아니다. 훈련 데이터 구성을 공개했다는 점에서 차별화된다.

지원 모달리티 — 텍스트, 이미지, 비디오, 오디오 4개 동시 처리
훈련 데이터 출처 — Qwen, GPT-OSS, Kimi, DeepSeek OCR 등 복수 오픈소스 모델 산출물 혼합
공개 방식 — 오픈소스 공개, 별도 API 없이 직접 다운로드 가능

단일 기업 데이터만으로 훈련하는 대신 여러 오픈소스 모델의 결과물을 혼합 활용한 방식은 현대 멀티모달 모델 개발 방식의 단면을 공개적으로 드러낸 사례다.

엔비디아가 왜 직접 모델을 내놓나

엔비디아는 지금까지 AI 학습·추론의 하드웨어(GPU) 공급자였다. Nemotron 시리즈 공개는 소프트웨어·모델 생태계 주도권 경쟁에 직접 참여한다는 신호다. 오픈소스 공개를 통해 개발자 커뮤니티를 자사 플랫폼(NVIDIA AI) 생태계로 끌어들이는 전략으로 읽힌다. 한국 개발자도 Hugging Face에서 바로 접근 가능하다.

지금 바로 다운로드해서 자체 태스크에 비교 테스트하라

Hugging Face에서 'Nemotron 3 Nano Omni'를 검색하면 바로 다운로드 가능하다. 기존에 쓰던 멀티모달 모델(예: LLaVA, Qwen-VL 등)과 동일한 입력으로 비교 테스트해 실제 차이를 직접 확인하라.

엔비디아, 오픈소스 멀티모달 모델 Nemotron 3 Nano Omni 공개

The Lead

기존 멀티모달 모델과 뭐가 다른가

엔비디아가 왜 직접 모델을 내놓나

지금 바로 다운로드해서 자체 태스크에 비교 테스트하라

Public Discussion

토론