개발일기

🤖 요즘 AI가 사내 문서 요약까지 해준다고요? RAG 구조로 보는 AI의 똑똑한 비결

뱅우 2025. 5. 9. 09:53
반응형

안녕하세요!
최근 ChatGPT나 Claude 같은 AI 어시스턴트를 보면,
“사내 문서 읽고 요약해줘”,
“DB에서 조건 맞는 데이터 뽑아줘”
같은 요청을 척척 처리하는 걸 자주 보게 됩니다.

대체 어떻게 이게 가능한 걸까요?

그 배경에는 바로 RAG 구조, 즉 Retrieval-Augmented Generation이 있습니다.

이번 글에서는 RAG가 무엇인지,
왜 요즘 AI에서 빠지지 않고 언급되는지,
실제로 어떻게 동작하는지 정리해보겠습니다.


🔍 RAG란?

RAG는 이름 그대로,
검색(Retrieval) + 생성(Generation) 을 결합한 구조입니다.

쉽게 말해,
"모델이 모든 걸 다 알고 있진 않지만, 필요한 정보를 찾아와서 답을 만들어내는 방식" 이에요.

기존의 LLM은 잘 학습되어 있긴 하지만,
💡 학습 시점 이후의 정보는 모릅니다.
💡 사내 문서나 데이터베이스 같은 내부 시스템과도 바로 연결되지 않죠.

RAG는 이런 한계를 보완하기 위해 검색을 모델의 기억처럼 활용하는 구조라고 이해하면 됩니다.


⚙️ 왜 필요할까?

아무리 똑똑한 모델이라도 다음과 같은 한계는 존재해요:

  • 최신 정보 모름 (예: 학습된 시점 이후의 뉴스, 문서 등)
  • 내부 문서/데이터베이스 접근 불가
  • 너무 많은 정보를 통째로 학습시키는 건 비용과 시간 면에서 부담

그래서 등장한 게 RAG 구조입니다.
필요할 때 검색해서, 그 내용을 기반으로 생성만 잘 하면 되니까요!


🧱 RAG 구조는 이렇게 생겼습니다

RAG는 보통 아래의 3단계 구조로 동작합니다:

단계역할설명
① Retriever 검색기 질문을 벡터로 변환 → 벡터DB/문서에서 유사한 정보 검색
② Generator 생성기 검색된 내용을 바탕으로 자연어 답변 생성 (GPT, Claude 등 활용)
③ Reranker (선택적) 재정렬기 검색된 결과를 더 관련성 높은 순서로 정렬
 

🧪 실제 사용 예시: 사내 문서 요약 어시스턴트

예를 들어, 사용자가 아래와 같은 질문을 했다고 해볼게요.

"우리 회사 연차 정책 요약해줘"

  1. Retriever가 회사의 Notion, Google Drive 등에서
    ‘연차’, ‘휴가’와 관련된 문서를 벡터 기반으로 검색합니다.
  2. Generator는 검색된 문서를 바탕으로
    자연어로 요약된 응답을 생성합니다:

“우리 회사는 1년에 15일의 연차가 제공되며, 연차는 다음 연도로 이월되지 않습니다.”

모델이 연차 정책을 ‘기억’하고 있던 게 아니라,
필요한 내용을 찾아보고, 이해해서 설명해준 것이죠.


✅ RAG의 장점

  • 📆 최신 정보 반영 가능
    (모델이 언제 학습됐는지는 중요하지 않아요!)
  • 📂 내부 시스템과 통합
    (문서, DB, 이메일 등 다양한 데이터 활용 가능)
  • 🧠 모델이 덜 똑똑해도 커버 가능
    (외부 정보를 끌어와서 정확도 향상)

❗ 단점도 있습니다

  • 🔍 검색 품질에 따라 답변 품질이 결정됨
    (관련 없는 문서를 가져오면 이상한 답변이 나올 수 있어요)
  • 🐢 속도 이슈
    (검색 + 생성 = 딜레이가 생길 수 있음)
  • 🔐 보안 이슈
    (내부 문서가 외부로 전송되지 않도록 관리 필요)

🧭 마무리하며

요즘 AI 어시스턴트에서 RAG 구조가 계속 언급되는 이유, 이제 좀 감이 오시죠?

모델이 모든 걸 외우고 있을 필요는 없습니다.
필요한 순간에 찾아보고, 요약해서 알려주는 방식
바로 그게 RAG의 핵심입니다.

Notion 문서나 Google Drive 파일을 AI가 요약해주는 방식은
실무 자동화팀 생산성 향상에 꽤 매력적인 접근이란 걸 체감하고 있습니다.

 

 

반응형