본문 바로가기

AI

구글 Gemini 2.5 Pro랑 CAG가 뭐냐면 말이지

25년, 또 하나의 AI 혁명인가? 
이번엔 구글이 만든 Gemini 2.5 Pro가 주인공인데,

이 모델이랑 같이 등장한 CAG(Cache-Augmented Generation) 라는 기술이 진짜 대박이야. 뭐 이리 빠른지??? RAG가 언제나왔는데... 
복잡하던 기존 방식은 이제 안녕~

진짜 심플하게 바뀌었거든. AI가 점점 더 똑똑해지는 것도 놀라운데, 이제는 쓰는 방법도 훨씬 쉬워졌다고 함.

 

Gemini 2.5 Pro? 그게 뭐야?

상상해봐. 백과사전 몇 권 분량의 정보를 AI가 한 번에 읽고 이해할 수 있다면?
그게 바로 Gemini 2.5 Pro야.

지금도 100만 토큰(단어 같은 데이터 단위)을 한 번에 처리하는데, 곧 200만 토큰까지 확장될 거래. 거의 인간 수준으로 맥락을 읽어낸다고 보면 돼.  ㅋㅋㅋ 이해안되지? ㅋㅋ 대략적으로 책 제목분량 (단어/자 수)토큰 수 추정200만 토큰과 비교하면 다음과 같아~ 이러면 이해된다. ㅎㅎㅎ

해리포터 전 시리즈 약 110만 단어 약 150만 토큰 약 80~90% 수준
반지의 제왕 (3부작) 약 48만 단어 약 65만 토큰 약 1/3 수준
삼국지 (한글 완역본) 약 200만 자 약 200만 토큰 거의 동일
웹소설 1,000화 1화 2,000자 기준 약 200만 자 거의 동일

 

어째든 이 모델은 그냥 단순히 대답만 하는 게 아니라,

생각하면서 말하는 AI야. 질문을 딱 던지면, 알아서 자료 보고 분석해서 정답을 내놓지.

대박인 건, 이걸 무료로 쓸 수 있다는 거! (물론 살짝 제한은 있긴 해 ㅎㅎ)

[출처: 구글코리아 블로그 캡처]

 

😵‍💫 예전엔 RAG라는 걸 썼는데, 이게 꽤 복잡했어

기존에는 RAG라는 방식을 많이 썼어.

이름부터 뭔가 어려워 보이지? Retrieval-Augmented Generation의 줄임말이야.
간단히 말하면, 질문이 들어오면 관련 정보를 검색해서 그걸 기반으로 대답을 만들어내는 방식이야. 소위 말하는 기업이나 참고해야 할 만한 문서를 기반으로 만드는데... 그 기반으로 만드는 과정이 생각보다 복잡했다는 의미죠 :) 

  • 문서를 잘게 잘라서(청크 분할)
  • 숫자 코드(임베딩)로 바꾸고
  • 데이터베이스에 저장한 다음
  • 질문이 들어오면 비슷한 문서를 찾아서
  • AI한테 전달하고 대답을 만들어야 했거든

이게 단계도 많고, 어디 하나 삐끗하면 잘못된 답이 나올 수도 있었어. 특히 정보가 자주 바뀌는 경우에는 진짜 골치 아팠다고 함. 사실 나는 사용자 입장이니 그렇다더라 ㅎㅎㅎ

 

😎 그런데 CAG가 등장하면서 판이 바뀌었어

CAG(Cache-Augmented Generation)는 이름처럼 '캐시'를 활용한 새로운 방식이야.
그냥 필요한 문서를 미리 읽어둔 다음, 캐시에 저장하고 있다가 질문이 들어오면 바로 대답하는 구조야.

예를 들면 이런 거야.

  • 도서관 가서 매번 책 찾는 게 RAG
  • 필요한 책을 미리 책상에 펼쳐놓고 쓰는 게 CAG

진짜 간단하지? 중간 과정이 아예 사라졌어. 덕분에 빠르고 정확하게 답할 수 있어. 그리고 시스템 관리도 훨씬 쉬워졌고! 

 

🔥 왜 이제는 다들 CAG 쓰고 싶어할까?

옛날에는 긴 문서를 한 번에 다루는 게 느리고 비쌌어. 근데 지금은 아니야.

  • 모델 사용 비용이 많이 줄었고
  • 처리 속도도 빨라졌고
  • 자주 쓰는 데이터는 한 번만 처리하고 재활용도 가능해졌거든!

결국 CAG는 지금의 환경에 딱 맞는 방식이 된 거지. CAG의 장점 요약하면 이래!

  • ✅ 빠름 ✅ 정확함 ✅ 관리가 편함

 

⚔️ 한국사회는 엄친아 좋아하잖아 ㅎㅎㅎ  RAG vs CAG 붙여봤는데?

연구자들이 유명한 질문 데이터셋으로 두 방식을 비교해봤대.
결과는? CAG 완승! RAG보다 더 빠르고 정확했대.

특히 여러 문서를 종합해서 대답해야 하는 질문에서는 CAG가 진짜 제 역할을 제대로 해줬다고 해.

 

💡 그럼 CAG는 어디서 쓸 수 있을까?

진짜 생각보다 쓸 데가 많아!

  1. 병원: 환자 기록, 약물 정보 등 미리 캐시에 저장 → 의사가 바로 확인
  2. 법률: 판례, 법 조항 같은 거 저장해두고 → 상담 시 바로 활용
  3. 회사 내부 시스템: 정책이나 업무 프로세스를 캐시해두고 → 직원이 물어보면 바로 답
  4. 교육: 수업 자료 미리 저장 → 학생 질문에 AI가 바로 설명

이런 데서 RAG보다 훨씬 유리하게 작동해.

 

✅ 복잡한 건 이제 그만! 단순함이 진짜 혁신이야

이제는 쪼개고, 저장하고, 검색하고… 그럴 필요 없어.
필요한 정보만 딱 준비해서 한 번에 AI한테 전달하면 끝!

서비스 기획자든, 개발자든, 일반 사용자든
이제는 AI를 훨씬 쉽게, 더 강력하게 활용할 수 있는 시대가 온 거야.

Gemini 2.5 Pro + CAG 조합은 앞으로 AI 서비스의 기본 공식이 될지도 몰라.
기술은 결국 복잡함에서 단순함으로 진화하니까 말이지.