RAG Agent 상세 기획 문서

📋 목차

  1. 시스템 아키텍처 개요
  2. 청킹 전략 (Chunking Strategy)
  3. 리트리버 전략 (Retrieval Strategy)
  4. 출력 전략 (Output Strategy)
  5. 통합 워크플로우
  6. 성능 평가 지표
  7. 구현 우선순위 (4일 계획)
  8. 예상 도전 과제 및 대응
  9. 참고 자료
  10. PDF → 채용공고 추출 및 엑셀화 전략

"의미로 찾고(Vector) + 키워드로 찾고(BM25) + 순위를 합치고(RRF) + 정밀 검수하고(Rerank) + 골고루 보여주는(Diversity)" 아주 견고한 RAG(검색 증강 생성)의 핵심 파이프라인

1. 시스템 아키텍처 개요

본 시스템은 채용공고의 법적 리스크를 분석하기 위해 전처리, 하이브리드 검색, 재랭킹, LLM 생성이 통합된 RAG 기반 파이프라인을 사용한다.

[사용자 입력]
        ↓
[전처리]
        ↓
[청킹]
        ↓
[임베딩]
        ↓
[하이브리드 검색]
        ↓
[재랭킹]
        ↓
[컨텍스트 병합]
        ↓
[프롬프트 조립]
        ↓
[LLM 생성]
        ↓
[출력 포맷팅]

1.1 핵심 설계 원칙

Zero Hallucination