OCR
문서 이미지를 RAG가 읽을 수 있는 구조로 바꿉니다
Schift OCR은 단순 텍스트 추출이 아니라 표, 차트, 레이아웃, 근거 위치를 함께 보는 문서 이해 파이프라인입니다. 공개 벤치마크는 OCR 품질을 텍스트 유사도 하나로 숨기지 않고, 실제 RAG 입력으로 쓸 수 있는지까지 검증하는 방향으로 정리합니다.
- Tables / Charts / Content Fidelity / Semantic Format / Grounding 축 공개
- 한국어 문서와 스캔 PDF 중심 평가
- 업로드 → OCR → 검색 근거까지 이어지는 end-to-end 품질 측정