PDF OCR 워크플로우

1️⃣ PDF 파일 업로드

처리할 PDF 파일을 선택하세요

📋 PDF 문서 유형

🔍 자동 감지
문서 유형을 자동으로 판별 📰 신문·방송 스크랩
이미지 기반 스캔 PDF 🏛️ 정부·공공 문서
텍스트·표 혼합 PDF

자동 감지: 파일명·메타데이터·텍스트 추출 가능 여부로 문서 유형을 판별합니다.

📁

파일을 드래그하거나 클릭하여 선택

PDF 파일 (최대 500MB)

2️⃣ 테스트 페이지 선택

OCR 설정을 테스트할 페이지를 선택하세요

💡 첫 번째 페이지로 설정을 테스트한 후, 전체 문서에 적용합니다.

⚠️ PDF 파일이 로드되지 않았습니다. 1단계로 돌아가서 파일을 업로드하세요.

페이지 선택:

📊 자동 샘플 분석 (권장)

여러 페이지를 자동으로 분석하여 최적의 OCR 설정을 추천합니다.
분석 페이지: 1페이지(표지), 2페이지(첫 본문), 중간 페이지

⚠️ 아래 버튼을 클릭하여 샘플 분석을 반드시 실행하세요

3️⃣ OCR 테스트 실행

추출된 페이지로 OCR 테스트를 실행합니다

⚠️ 테스트 페이지가 없습니다. 2단계로 돌아가서 페이지를 추출하세요.

4️⃣ 결과 비교

추출된 텍스트와 원본 이미지를 비교하여 OCR 품질을 확인합니다

ℹ️ 이전 단계에서 OCR 테스트를 완료하면 결과가 여기에 표시됩니다.

5️⃣ 설정 조절

테스트 결과를 바탕으로 OCR 설정을 조정합니다

💡 샘플 분석 결과를 기반으로 추천 설정이 적용되어 있습니다. 필요시 수동으로 조정할 수 있습니다.

⚙️ OCR 설정

해상도 (DPI) 권장: 300 (고품질), 150 (빠른 처리)

OCR 엔진 Tesseract (빠름, 범용) EasyOCR (정확함, 느림)

PSM 모드

영역 분할 권장: 1 (깨끗한 문서), 5-8 (복잡한 레이아웃)

자동 이미지 보정

🦙 Ollama LLM (로컬 AI 텍스트 정제)

Ollama 텍스트 정제 활성화 (OCR 후 자동 보정) OCR 결과의 띄어쓰기, 오타를 로컬 LLM으로 자동 교정 (무료, 비용 없음)

Ollama 모델 ℹ️ Ollama 서버에 설치된 모델만 선택 가능

정제 적용 기준 (신뢰도)

항상 적용 (0%) 32% 적용 안함 (100%)

💡 신뢰도가 이 값보다 낮은 페이지만 Ollama로 정제

모든 페이지 정제 (신뢰도 무시) ⚠️ 처리 시간이 크게 증가할 수 있습니다

🤖 Claude Vision (AI 고급 OCR)

Claude Vision 활성화 (낮은 신뢰도 페이지 자동 재처리) 기존 OCR 신뢰도가 낮을 때 Claude AI로 자동 재처리하여 정확도 향상

Fallback 임계값 (현재: 0.55) 신뢰도가 이 값보다 낮으면 Claude Vision 사용 (낮을수록 많이 사용)

💰 예상 비용

페이지당 비용

$0.12

예상 총 비용

$0.00

0개 페이지 예상 (총 14페이지 중 약 0%)

✨ Claude Vision 장점

저품질 이미지에서 95%+ 정확도
복잡한 레이아웃 자동 이해
왜곡된 텍스트 정확 인식
자동 오타 교정 및 문맥 이해

⚠️ 아래 버튼을 클릭하여 설정을 저장하세요

설정 저장 후 화면 하단의 다음 → 버튼을 클릭해야 합니다

6️⃣ 최종 확인

전체 OCR 실행 전 설정을 확인합니다

✅ 모든 설정이 완료되었습니다. 아래 내용을 확인하고 OCR을 시작하세요.

📋 OCR 작업 요약

PDF 파일	미설정
처리 범위	전체 페이지
해상도	450 DPI
OCR 엔진	Tesseract, EasyOCR
자동 보정	활성화
Claude Vision AI	비활성화
예상 시간	약 10-15분

⚠️ OCR 처리 중에는 다른 작업을 진행하지 마세요. 브라우저를 닫지 말고 기다려 주세요.

7️⃣ 전체 추출 준비

전체 OCR 실행 준비가 완료되었습니다

✅ 모든 설정이 완료되었습니다. "다음" 버튼을 클릭하여 일괄 OCR을 시작하세요.

🚀

일괄 OCR 실행 준비 완료

설정된 옵션으로 전체 페이지 OCR을 진행합니다.
처리 시간: 약 10-15분 소요 예상

8️⃣ 일괄 OCR 실행

전체 페이지 또는 선택한 페이지에 대해 OCR을 실행합니다

📋 OCR 설정

파일 ID

총 페이지 수

페이지 범위 예: all (전체), 1-5 (1~5페이지), 1,3,7 (1,3,7페이지만), 1-3,7,10-12 (조합)

자동 이미지 보정

OCR 엔진 선택 Ctrl+클릭으로 다중 선택 (최소 1개)

📊 출력 형식 📰 구조화된 출력: 신문사명, 면수, 제목, 날짜를 자동으로 추출하여 JSON 형식으로 저장

📦 컨텐츠 분해 (방법 B)

페이지 이미지에서 텍스트/이미지 영역을 자동 감지하여 페이지별 JSON · MD · HTML 파일을 생성합니다.

HTML 모드

페이지 범위

⬇️ olmOCR 분해를 실행하세요 ⬇️
아래 버튼을 클릭해야 다음 단계로 진행할 수 있습니다

🔬 olmOCR 컨텐츠 분해 (VLM 기반)

Allen AI olmOCR (7B VLM) 을 사용하여 페이지별 고정밀 텍스트를 추출합니다.
※ 첫 실행 시 GPU 워밍업으로 수 분이 소요될 수 있습니다.

페이지 범위

타임아웃(초)

9️⃣ 결과 병합

OCR 결과를 확인하고 최종 텍스트 파일을 생성합니다

ℹ️ Step 8에서 OCR이 완료되면 자동으로 결과가 병합됩니다.

🎉 OCR 처리 완료!

모든 작업이 성공적으로 완료되었습니다

✅

OCR 추출 완료!

PDF 파일에서 텍스트가 성공적으로 추출되었습니다.

📥 결과 다운로드

📄 추출 텍스트 다운로드 (.txt) 👁️ 뷰어에서 결과 확인

💡 다음 단계

추출된 텍스트 파일을 검토하고 필요시 수동 보정
표 형식이나 레이아웃이 필요한 경우 수동으로 재구성
다른 PDF 파일을 처리하려면 "새로운 워크플로우" 버튼 클릭

🏠 메인 페이지로

📄 PDF OCR 워크플로우

1️⃣ PDF 파일 업로드

파일을 드래그하거나 클릭하여 선택

2️⃣ 테스트 페이지 선택

📊 자동 샘플 분석 (권장)

3️⃣ OCR 테스트 실행

4️⃣ 결과 비교

5️⃣ 설정 조절

⚙️ OCR 설정

🦙 Ollama LLM (로컬 AI 텍스트 정제)

🤖 Claude Vision (AI 고급 OCR)

💰 예상 비용

6️⃣ 최종 확인

📋 OCR 작업 요약

7️⃣ 전체 추출 준비

일괄 OCR 실행 준비 완료

8️⃣ 일괄 OCR 실행

📋 OCR 설정

📦 컨텐츠 분해 (방법 B)

⏳ 컨텐츠 분해 중...

✅ 컨텐츠 분해 완료!

❌ 오류

🔬 olmOCR 컨텐츠 분해 (VLM 기반)

🔬 olmOCR 분석 중...

✅ olmOCR 분해 완료!

❌ olmOCR 오류

⏳ OCR 처리 중...

✅ OCR 완료!

❌ 오류 발생

9️⃣ 결과 병합

📊 최종 통계

📄 생성된 파일

📄 페이지별 추출 결과

🎉 OCR 처리 완료!

OCR 추출 완료!

📥 결과 다운로드

🔬 olmOCR 분해 결과 다운로드

💡 다음 단계