🧠 RWS 평가 기준 이해하기
Groundedness와 Completeness, 어디까지 아시나요?
📌 목차
- Groundedness와 Completeness란?
- 둘의 핵심 차이
- 실제 예시로 비교해 보기
- 자주 하는 실수
- 채점 기준에 맞는 해설 작성법
- 마무리 요약
1. Groundedness와 Completeness란?
RWS 프로젝트에서 AI가 만든 응답을 평가할 때
가장 자주 등장하는 두 기준이 바로 이거예요.
Groundedness | 답변이 **제공된 문서(컨텍스트)**에 근거하고 있는가 |
Completeness | 질문에 대해 충분히 답변했는가, 빠진 정보는 없는가 |
둘 다 "답변의 품질"을 따지는 기준이지만,
Groundedness는 ‘정확성’, Completeness는 ‘충분함’을 평가하는 거예요.
2. 둘의 핵심 차이
초점 | 답변이 문서에 기반했는가 | 질문의 모든 요구를 충족했는가 |
오류 기준 | 문서에 없는 내용을 말하면 감점 | 질문의 일부만 답하면 감점 |
키워드 | “사실 기반”, “출처 일치” | “전부 다 답했는가” |
✔️ Groundedness는 사실 체크
✔️ Completeness는 질문 커버 범위 체크
3. 실제 예시로 비교해 보기
📄 문서 내용
“The iPhone 14 Pro has a 48MP main camera and a 120Hz display.”
🟩 예시 1:
“Yes, the iPhone 14 Pro features a 48MP main camera and supports 120Hz refresh rate.”
- ✅ Groundedness: Good (둘 다 문서에 있음)
- ✅ Completeness: Good (질문에 완벽히 답함)
🟥 예시 2:
“Yes, the iPhone 14 Pro has a 48MP camera and a telephoto lens.”
- ❌ Groundedness: Bad (문서에 telephoto lens는 없음)
- ✅ Completeness: OK (질문엔 답했음)
🟧 예시 3:
“Yes, it has a 48MP camera.”
- ✅ Groundedness: Good
- ❌ Completeness: Bad (120Hz 언급 누락)
💸 Appen Yukon vs TELUS Ads
어떤 게 더 수익날까? 실전 비교 분석📌 목차두 프로젝트의 기본 개요작업 방식과 난이도수익 구조 비교유지 기간 & 품질 평가 시스템어떤 사람에게 어떤 프로젝트가 맞을까?마무리 요약1. 두
sweetoffee.tistory.com
4. 자주 하는 실수
- Groundedness 기준인데, 답변이 그럴듯하다고 ‘좋음’으로 평가
- Completeness 기준인데, 일부만 답했는데도 괜찮다고 생각함
- 문서 확인 없이 기억이나 상식으로 채점
- 답변에 오류는 없지만, 필요한 정보가 빠졌다는 걸 놓침
💡 기억: Grounded는 “문서 기반 여부”, Complete는 “내용 빠짐 여부”
5. 채점 기준에 맞는 해설 작성법
Groundedness 해설 예시
“The answer mentions a feature (telephoto lens) that is not supported by the document. Therefore, it lacks sufficient grounding.”
Completeness 해설 예시
“The answer only covers the 48MP camera and omits the 120Hz display. Thus, the response is incomplete.”
✔️ ‘왜 감점인지’를 기준 용어로 명확히 적는 것이 핵심!
✅ 마무리 요약
중심 질문 | 문서에 있었는가? | 다 답했는가? |
감점 포인트 | 사실 오류, 없는 정보 추가 | 정보 누락, 일부만 답함 |
평가 팁 | 문서 내용과 정확히 비교 | 질문 항목 하나하나 체크 |
📖 “근거는 문서에서, 완성은 질문에서.”
– RWS 기준 이해의 정석