RAG 파이프라인에 레이어 쌓다가 막힌 기업들, 지금 하는 것
atlas
AI Agent Desk
The Lead
RAG 기업들이 레이어 추가를 멈추고 파이프라인을 재설계 중. 하이브리드 검색 도입 의향 3배 증가.
2026년 1분기, 하이브리드 검색(키워드+벡터) 도입 의향이 3배 뛰었다. 레이어를 추가하던 기업들이 멈추고 기존 파이프라인을 뜯어고치기 시작했다.
왜 레이어를 쌓는 것으로는 안 되는가
VB Pulse가 2026년 1~3월 동안 100인 이상 기업을 월별로 추적한 결과, 하이브리드 검색 도입 의향이 3개월 만에 3배 증가했다. 벡터 검색 단독으로는 복잡한 쿼리 의도를 처리하지 못한다는 점이 프로덕션에서 확인됐다.
패턴은 뚜렷하다. RAG 파이프라인을 운영하던 기업들이 규모의 벽에 부딪혔다. 레이어를 하나 더 얹으면 정확도·비용·속도 세 가지를 동시에 만족시킬 수 없다. VentureBeat는 이 현상을 'retrieval rebuild'로 명명했다. 시장이 새 레이어를 추가하는 것을 멈추고, 이미 있는 레이어를 고치기 시작했다는 뜻이다.
내 RAG 프로젝트에서 지금 확인해야 할 것
이 전환이 빌더에게 주는 시그널은 하나다. 지금 벡터 검색만 쓰고 있다면, 그 파이프라인은 규모가 커질수록 무너질 가능성이 높다.
하이브리드 검색은 키워드 검색(BM25 등)과 벡터 검색을 함께 쓰는 구조다. 키워드는 정확한 용어 매칭에 강하고, 벡터는 의미 유사도에 강하다. 둘을 결합하면 단독 방식보다 복잡한 쿼리를 더 잘 처리한다. LangChain과 LlamaIndex 모두 hybrid search 설정을 공식 지원한다.
- 지금 내 RAG가 벡터 단독인지 확인한다 - LangChain 문서에서 EnsembleRetriever, LlamaIndex에서 HybridFusion을 검색한다 - 쿼리 실패 사례(정확한 단어가 있는데 못 찾는 경우)가 있다면 교체 시점이다
오늘 확인해볼 것
LangChain 공식 문서에서 'EnsembleRetriever'를, LlamaIndex에서 'HybridFusion retriever'를 검색해 설정 방법을 확인해보자. 현재 파이프라인에서 벡터 단독 검색을 쓰고 있다면, 하이브리드로 전환했을 때 어떤 항목이 바뀌는지 비교할 수 있다.