랭그래프 구조 변경 전후의 생성 품질을 비교하기 위한 공통 채점 기준입니다.

사람 평가 및 Judge 에이전트 평가에 함께 사용합니다.


📋 평가 방식

점수 해석
1점 매우 부족함
2점 부족함
3점 보통
4점 좋음
5점 매우 좋음

점수 부여 원칙


❓ 질문 품질 평가 루브릭

평가항목 정의 1점 2점 3점 4점 5점
직무 관련성 질문이 채용 직무의 핵심 역량, 실제 업무, JD 요구사항과 얼마나 직접 연결되는지 직무와 거의 무관함 직무와의 연결이 약하고 일반론적임 직무와 관련은 있으나 다소 일반적임 직무 요구와 꽤 밀접하나 핵심성은 일부 부족함 직무 핵심 역량과 직접 연결됨
문서 근거성 질문이 지원서, 이력서, 포트폴리오 등 입력 문서의 실제 내용에 기반하는지 문서 근거가 거의 없음 문서 언급은 있으나 매우 피상적이거나 연결이 약함 문서 기반은 있으나 연결이 약함 문서 내용과 비교적 잘 연결되나 세부 근거가 조금 부족함 문서의 구체적 경험·성과·역할과 명확히 연결됨
검증력 실제 역량, 기여도, 문제해결력, 경험의 진위를 확인하는 데 효과적인지 검증 기능이 거의 없음 형식적 확인은 가능하나 실제 역량 검증은 약함 기본 검증은 가능함 역량과 기여도를 꽤 잘 검증하나 깊이는 다소 아쉬움 실제 기여도와 역량 수준까지 강하게 검증 가능함
구체성 추상적이지 않고 답변 범위와 확인 포인트가 분명한지 매우 추상적임 질문 의도는 보이나 범위가 넓고 모호함 이해는 가능하나 다소 넓거나 모호함 답변 범위와 확인 포인트가 대체로 분명함 무엇을 확인할지 분명한 구체적 질문임
면접 사용성 면접관이 현장에서 바로 읽고 사용할 수 있을 정도로 자연스럽고 실용적인지 현장 사용이 어려움 문장은 이해되나 어색하거나 실전 사용성이 낮음 사용은 가능하나 다듬을 여지 있음 현장에서 무리 없이 사용 가능하나 약간 다듬으면 더 좋아짐 바로 사용 가능한 자연스럽고 실용적인 질문임

질문 품질 총점 해석

항목 수 5개 × 15점 = **총점 범위 525점**