본문 바로가기

AI

RAG는 끝났을까? Gemini 2.0 Flash가 보여준 AI의 다음 스텝

얼마 전에 구글이 발표한 Gemini 2.0 Flash 모델이 AI 업계에서 꽤 화제였어.

특히 이 모델이 RAG(Retrieval-Augmented Generation) 기술을 대체할 수 있다는 얘기까지 나오고 있지.

나도 그 발표 보면서 꽤 인상 깊었고, 이게 진짜로 RAG를 obsolete 하게 만들지에 대해서 한 번 정리해보고 싶었어.

* ‘obsolete(옵솔리트)’라는 용어가 나오는데, 이건 ‘더 이상 쓸모없게 된’, ‘구식이 된’이라는 뜻이야. 즉, Gemini 2.0 Flash가 너무 좋아져서, 예전 방식(RAG 같은 복잡한 정보 검색+생성 방식)은 이제 필요 없어질지도 모른다는 거지.

 

먼저, RAG는 뭥미?

RAG, 풀네임은 Retrieval-Augmented Generation.

말 그대로 AI가 ‘검색해서 생성’하는 방식이야. 예전에는 AI가 자기 훈련 데이터 안에서만 대답할 수 있었거든?

근데 RAG는 외부 지식도 끌어와서, 마치 "나 이건 몰라서 검색 좀 해볼게!" 하고 답하는 거지.

우리가 요즘 쓰는 Perplexity, Bing AI, 혹은 파일 업로드하고 묻는 ChatGPT 같은 기능들 있잖아?

다 RAG 기반이라고 보면 돼. AI가 외부에서 정보를 찾아서, 마치 자기 지식처럼 대답하는 구조야.

 

RAG가 왜 그렇게 중요했을까?

그 이유는 간단해. 초기의 AI들은 ‘기억력’이 너무 짧았거든.

23년 초만 해도 겨우 4,000 토큰밖에 못 다뤘어. 한글로 치면 대충 6~7페이지 분량?

그래서 문서가 길면 잘라서 조각조각(chunking) 만들고,

벡터로 변환해서 데이터베이스에 넣고, 필요할 때 꺼내서 보여주는 방식이 필요했지.

근데 이게 진짜 귀찮고 복잡했어. 설정도 어렵고, 임베딩 퀄리티도 신경 써야 하고, 검색 정확도도 변수였고.

RAG는 그걸 극복하기 위한 “막일 기반 해결책”이었어.

 

그런데, Gemini 2.0 Flash가 나타났다?

구글이 이번에 공개한 Gemini 2.0 Flash는 단순히 빠르고 가볍다는 걸 넘어서,

"RAG Killer"라는 얘기까지 나오고 있어. (진짜 이름부터 강렬함ㅋㅋ)

이 모델은 기존처럼 복잡한 RAG 프로세스를 안 거쳐도,

그냥 많은 정보를 한 번에 다룰 수 있는 능력을 갖췄다는 게 핵심 포인트야.

요약하자면 “이제 굳이 검색하고 꺼내서 넣고 하지 않아도 된다”는 거지.

[이미지 출처: https://blog.google/feed/gemini-app-experimental-models/]

 

왜 RAG가 점점 밀릴 수도 있냐면...

전통적인 RAG 방식은 아래처럼 단계를 꽤 많이 거쳐야 해

  1. 참조할 문서를 작은 조각으로 나눔 (chunking)
  2. 벡터화해서 DB에 저장 (embedding)
  3. 질문이 들어오면 관련 내용 검색
  4. 그걸 다시 AI에 넣어서 응답 생성

문제는 이 전체 과정이 복잡하고, 인프라 비용도 많이 들고, 검색 정확도도 완벽하진 않다는 점이야.

특히 “나 이거 봤는데 왜 못 찾냐?” 같은 일들 자주 있었지.

 

Gemini 2.0 Flash가 바꿀 수 있는 것들

내가 보기엔 Gemini 2.0 Flash가 가져올 변화는 꽤 현실적이야!

  • 개발이 더 쉬워질 듯: 굳이 RAG 구성 안 해도 되니까, 개발자 입장에서 진입장벽이 낮아짐.
  • 운영 비용 줄어듦: 벡터 DB 운영 안 해도 되니까, 인프라 단순화 + 비용 절감.
  • 정확도도 기대됨: 검색 오류 없이 한 번에 큰 문서를 직접 분석할 수 있다면, 정보 손실 줄일 수 있겠지.
  • 누구나 고급 AI 가능: 기술 없이도 AI를 활용할 수 있는 범위가 넓어짐. 말 그대로 민주화된 AI.

 

물론, 지금 바로 “RAG는 끝났다!”라고 선언하긴 어려워.

솔직히... 너무 AI 기술이 하루가 다르게 빠르다고 할까?

특정 상황에서는 여전히 RAG가 유용할 수도 있고, 벡터 기반 검색이 더 효율적인 경우도 있을 거야.

특히 기업 데이터처럼 폐쇄적인 환경에선 RAG가 여전히 빛을 발할 수 있지...

하지만, 분명한 건 Gemini 2.0 Flash 같은 모델이 나오면서 ‘RAG가 유일한 솔루션은 아니다’라는 시대가 왔다는 점이야.

앞으로는 RAG 없이도 훨씬 많은 걸 해낼 수 있는 모델들이 주류가 될 가능성이 크다고 봐.

RAG가 완전히 끝나진 않았지만, 게임은 바뀌고 있다