📄 PDF OCR 워크플로우

스캔 PDF에서 텍스트를 추출하는 완전한 프로세스

1
PDF 업로드
2
테스트 추출
3
OCR 테스트
4
결과 비교
5
설정 조절
6
확인
7
전체 추출
8
일괄 OCR
9
결과 병합
10
완료

1️⃣ PDF 파일 업로드

처리할 스캔 PDF 파일을 선택하세요

📁

파일을 드래그하거나 클릭하여 선택

PDF 파일 (최대 500MB)

2️⃣ 테스트 페이지 선택

OCR 설정을 테스트할 페이지를 선택하세요

💡 첫 번째 페이지로 설정을 테스트한 후, 전체 문서에 적용합니다.
⚠️ PDF 파일이 로드되지 않았습니다. 1단계로 돌아가서 파일을 업로드하세요.

📊 자동 샘플 분석 (권장)

여러 페이지를 자동으로 분석하여 최적의 OCR 설정을 추천합니다.
분석 페이지: 1페이지(표지), 2페이지(첫 본문), 중간 페이지

⚠️ 아래 버튼을 클릭하여 샘플 분석을 반드시 실행하세요

3️⃣ OCR 테스트 실행

추출된 페이지로 OCR 테스트를 실행합니다

⚠️ 테스트 페이지가 없습니다. 2단계로 돌아가서 페이지를 추출하세요.

4️⃣ 결과 비교

추출된 텍스트와 원본 이미지를 비교하여 OCR 품질을 확인합니다

ℹ️ 이전 단계에서 OCR 테스트를 완료하면 결과가 여기에 표시됩니다.

5️⃣ 설정 조절

테스트 결과를 바탕으로 OCR 설정을 조정합니다

💡 샘플 분석 결과를 기반으로 추천 설정이 적용되어 있습니다. 필요시 수동으로 조정할 수 있습니다.

⚙️ OCR 설정

권장: 300 (고품질), 150 (빠른 처리)
권장: 1 (깨끗한 문서), 5-8 (복잡한 레이아웃)

🦙 Ollama LLM (로컬 AI 텍스트 정제)

OCR 결과의 띄어쓰기, 오타를 로컬 LLM으로 자동 교정 (무료, 비용 없음)
ℹ️ Ollama 서버에 설치된 모델만 선택 가능
항상 적용 (0%) 32% 적용 안함 (100%)
💡 신뢰도가 이 값보다 낮은 페이지만 Ollama로 정제
⚠️ 처리 시간이 크게 증가할 수 있습니다

🤖 Claude Vision (AI 고급 OCR)

기존 OCR 신뢰도가 낮을 때 Claude AI로 자동 재처리하여 정확도 향상
신뢰도가 이 값보다 낮으면 Claude Vision 사용 (낮을수록 많이 사용)
💰 예상 비용
페이지당 비용
$0.12
예상 총 비용
$0.00
0개 페이지 예상 (총 14페이지 중 약 0%)
✨ Claude Vision 장점
  • 저품질 이미지에서 95%+ 정확도
  • 복잡한 레이아웃 자동 이해
  • 왜곡된 텍스트 정확 인식
  • 자동 오타 교정 및 문맥 이해
⚠️ 아래 버튼을 클릭하여 설정을 저장하세요
설정 저장 후 화면 하단의 다음 → 버튼을 클릭해야 합니다

6️⃣ 최종 확인

전체 OCR 실행 전 설정을 확인합니다

✅ 모든 설정이 완료되었습니다. 아래 내용을 확인하고 OCR을 시작하세요.

📋 OCR 작업 요약

PDF 파일 미설정
처리 범위 전체 페이지
해상도 450 DPI
OCR 엔진 Tesseract, EasyOCR
자동 보정 활성화
Claude Vision AI 비활성화
예상 시간 약 10-15분
⚠️ OCR 처리 중에는 다른 작업을 진행하지 마세요. 브라우저를 닫지 말고 기다려 주세요.

7️⃣ 전체 추출 준비

전체 OCR 실행 준비가 완료되었습니다

✅ 모든 설정이 완료되었습니다. "다음" 버튼을 클릭하여 일괄 OCR을 시작하세요.
🚀

일괄 OCR 실행 준비 완료

설정된 옵션으로 전체 페이지 OCR을 진행합니다.
처리 시간: 약 10-15분 소요 예상

8️⃣ 일괄 OCR 실행

전체 페이지 또는 선택한 페이지에 대해 OCR을 실행합니다

📋 OCR 설정

예: all (전체), 1-5 (1~5페이지), 1,3,7 (1,3,7페이지만), 1-3,7,10-12 (조합)
Ctrl+클릭으로 다중 선택 (최소 1개)
📰 구조화된 출력: 신문사명, 면수, 제목, 날짜를 자동으로 추출하여 JSON 형식으로 저장

📦 컨텐츠 분해 (방법 B)

페이지 이미지에서 텍스트/이미지 영역을 자동 감지하여 페이지별 JSON · MD · HTML 파일을 생성합니다.

⬇️ olmOCR 분해를 실행하세요 ⬇️
아래 버튼을 클릭해야 다음 단계로 진행할 수 있습니다

🔬 olmOCR 컨텐츠 분해 (VLM 기반)

Allen AI olmOCR (7B VLM) 을 사용하여 페이지별 고정밀 텍스트를 추출합니다.
※ 첫 실행 시 GPU 워밍업으로 수 분이 소요될 수 있습니다.

9️⃣ 결과 병합

OCR 결과를 확인하고 최종 텍스트 파일을 생성합니다

ℹ️ Step 8에서 OCR이 완료되면 자동으로 결과가 병합됩니다.

🎉 OCR 처리 완료!

모든 작업이 성공적으로 완료되었습니다

OCR 추출 완료!

PDF 파일에서 텍스트가 성공적으로 추출되었습니다.

📥 결과 다운로드

📄 추출 텍스트 다운로드 (.txt) 👁️ 뷰어에서 결과 확인

💡 다음 단계

  • 추출된 텍스트 파일을 검토하고 필요시 수동 보정
  • 표 형식이나 레이아웃이 필요한 경우 수동으로 재구성
  • 다른 PDF 파일을 처리하려면 "새로운 워크플로우" 버튼 클릭
🏠 메인 페이지로