안녕하세요!
최근 ChatGPT나 Claude 같은 AI 어시스턴트를 보면,
“사내 문서 읽고 요약해줘”,
“DB에서 조건 맞는 데이터 뽑아줘”
같은 요청을 척척 처리하는 걸 자주 보게 됩니다.
대체 어떻게 이게 가능한 걸까요?
그 배경에는 바로 RAG 구조, 즉 Retrieval-Augmented Generation이 있습니다.
이번 글에서는 RAG가 무엇인지,
왜 요즘 AI에서 빠지지 않고 언급되는지,
실제로 어떻게 동작하는지 정리해보겠습니다.
🔍 RAG란?
RAG는 이름 그대로,
검색(Retrieval) + 생성(Generation) 을 결합한 구조입니다.
쉽게 말해,
"모델이 모든 걸 다 알고 있진 않지만, 필요한 정보를 찾아와서 답을 만들어내는 방식" 이에요.
기존의 LLM은 잘 학습되어 있긴 하지만,
💡 학습 시점 이후의 정보는 모릅니다.
💡 사내 문서나 데이터베이스 같은 내부 시스템과도 바로 연결되지 않죠.
RAG는 이런 한계를 보완하기 위해 검색을 모델의 기억처럼 활용하는 구조라고 이해하면 됩니다.
⚙️ 왜 필요할까?
아무리 똑똑한 모델이라도 다음과 같은 한계는 존재해요:
- 최신 정보 모름 (예: 학습된 시점 이후의 뉴스, 문서 등)
- 내부 문서/데이터베이스 접근 불가
- 너무 많은 정보를 통째로 학습시키는 건 비용과 시간 면에서 부담
그래서 등장한 게 RAG 구조입니다.
필요할 때 검색해서, 그 내용을 기반으로 생성만 잘 하면 되니까요!
🧱 RAG 구조는 이렇게 생겼습니다
RAG는 보통 아래의 3단계 구조로 동작합니다:
① Retriever | 검색기 | 질문을 벡터로 변환 → 벡터DB/문서에서 유사한 정보 검색 |
② Generator | 생성기 | 검색된 내용을 바탕으로 자연어 답변 생성 (GPT, Claude 등 활용) |
③ Reranker (선택적) | 재정렬기 | 검색된 결과를 더 관련성 높은 순서로 정렬 |
🧪 실제 사용 예시: 사내 문서 요약 어시스턴트
예를 들어, 사용자가 아래와 같은 질문을 했다고 해볼게요.
"우리 회사 연차 정책 요약해줘"
- Retriever가 회사의 Notion, Google Drive 등에서
‘연차’, ‘휴가’와 관련된 문서를 벡터 기반으로 검색합니다. - Generator는 검색된 문서를 바탕으로
자연어로 요약된 응답을 생성합니다:
“우리 회사는 1년에 15일의 연차가 제공되며, 연차는 다음 연도로 이월되지 않습니다.”
모델이 연차 정책을 ‘기억’하고 있던 게 아니라,
필요한 내용을 찾아보고, 이해해서 설명해준 것이죠.
✅ RAG의 장점
- 📆 최신 정보 반영 가능
(모델이 언제 학습됐는지는 중요하지 않아요!) - 📂 내부 시스템과 통합
(문서, DB, 이메일 등 다양한 데이터 활용 가능) - 🧠 모델이 덜 똑똑해도 커버 가능
(외부 정보를 끌어와서 정확도 향상)
❗ 단점도 있습니다
- 🔍 검색 품질에 따라 답변 품질이 결정됨
(관련 없는 문서를 가져오면 이상한 답변이 나올 수 있어요) - 🐢 속도 이슈
(검색 + 생성 = 딜레이가 생길 수 있음) - 🔐 보안 이슈
(내부 문서가 외부로 전송되지 않도록 관리 필요)
🧭 마무리하며
요즘 AI 어시스턴트에서 RAG 구조가 계속 언급되는 이유, 이제 좀 감이 오시죠?
모델이 모든 걸 외우고 있을 필요는 없습니다.
필요한 순간에 찾아보고, 요약해서 알려주는 방식
바로 그게 RAG의 핵심입니다.
Notion 문서나 Google Drive 파일을 AI가 요약해주는 방식은
실무 자동화나 팀 생산성 향상에 꽤 매력적인 접근이란 걸 체감하고 있습니다.
'개발일기' 카테고리의 다른 글
📝 API는 왜 이렇게 많고 복잡할까? 좋은 API 설계의 기준은? (11) | 2025.05.16 |
---|---|
🧠 LLM도 ‘추론 능력’이 다 다르다? Chain-of-Thought란 무엇인가 (10) | 2025.05.14 |
📝 AI 시대, 검색보다 중요한 건 ‘질문력’이다 (15) | 2025.05.13 |
📝 GPTs와 AI 오토메이션: 개발자가 만드는 나만의 AI 비서 (18) | 2025.05.12 |
🧩 Model Context Protocol(MCP): AI와 데이터의 연결을 표준화하다 (8) | 2025.05.08 |