1️⃣ PDF 파일 업로드
처리할 스캔 PDF 파일을 선택하세요
파일을 드래그하거나 클릭하여 선택
PDF 파일 (최대 500MB)
2️⃣ 테스트 페이지 선택
OCR 설정을 테스트할 페이지를 선택하세요
📊 자동 샘플 분석 (권장)
여러 페이지를 자동으로 분석하여 최적의 OCR 설정을 추천합니다.
분석 페이지: 1페이지(표지), 2페이지(첫 본문), 중간 페이지
3️⃣ OCR 테스트 실행
추출된 페이지로 OCR 테스트를 실행합니다
4️⃣ 결과 비교
추출된 텍스트와 원본 이미지를 비교하여 OCR 품질을 확인합니다
5️⃣ 설정 조절
테스트 결과를 바탕으로 OCR 설정을 조정합니다
⚙️ OCR 설정
🦙 Ollama LLM (로컬 AI 텍스트 정제)
🤖 Claude Vision (AI 고급 OCR)
💰 예상 비용
- 저품질 이미지에서 95%+ 정확도
- 복잡한 레이아웃 자동 이해
- 왜곡된 텍스트 정확 인식
- 자동 오타 교정 및 문맥 이해
6️⃣ 최종 확인
전체 OCR 실행 전 설정을 확인합니다
📋 OCR 작업 요약
| PDF 파일 | 미설정 |
| 처리 범위 | 전체 페이지 |
| 해상도 | 450 DPI |
| OCR 엔진 | Tesseract, EasyOCR |
| 자동 보정 | 활성화 |
| Claude Vision AI | 비활성화 |
| 예상 시간 | 약 10-15분 |
7️⃣ 전체 추출 준비
전체 OCR 실행 준비가 완료되었습니다
일괄 OCR 실행 준비 완료
설정된 옵션으로 전체 페이지 OCR을 진행합니다.
처리 시간: 약 10-15분 소요 예상
8️⃣ 일괄 OCR 실행
전체 페이지 또는 선택한 페이지에 대해 OCR을 실행합니다
📋 OCR 설정
📦 컨텐츠 분해 (방법 B)
페이지 이미지에서 텍스트/이미지 영역을 자동 감지하여 페이지별 JSON · MD · HTML 파일을 생성합니다.
아래 버튼을 클릭해야 다음 단계로 진행할 수 있습니다
🔬 olmOCR 컨텐츠 분해 (VLM 기반)
Allen AI olmOCR (7B VLM) 을 사용하여 페이지별 고정밀 텍스트를 추출합니다.
※ 첫 실행 시 GPU 워밍업으로 수 분이 소요될 수 있습니다.
9️⃣ 결과 병합
OCR 결과를 확인하고 최종 텍스트 파일을 생성합니다
🎉 OCR 처리 완료!
모든 작업이 성공적으로 완료되었습니다
OCR 추출 완료!
PDF 파일에서 텍스트가 성공적으로 추출되었습니다.
📥 결과 다운로드
💡 다음 단계
- 추출된 텍스트 파일을 검토하고 필요시 수동 보정
- 표 형식이나 레이아웃이 필요한 경우 수동으로 재구성
- 다른 PDF 파일을 처리하려면 "새로운 워크플로우" 버튼 클릭