이미지 OCR (사진에서 글자 추출)

한국어 + 영어 자동 인식. 사진을 올리면 글자만 뽑아서 텍스트로 박아줍니다. 추출 결과는 검수 후 사용해주세요.

이미지를 여기에 드롭하거나 클릭하여 선택

JPG, PNG, WebP, GIF 지원 - 글자가 또렷한 이미지일수록 정확도가 높습니다

혹시 원하시는 툴이 아니신가요? 챗봇 질문하기로 원하시는 툴을 찾아보세요

쓰는 법

  1. 이미지 업로드 - 드래그하거나 클릭해서 선택. JPG·PNG·WebP·GIF 다 됩니다.
  2. 인식 언어 선택 - 기본은 「한국어 + 영어」 동시 인식. 영어만 있으면 「영어만」을 골라야 더 빠르고 정확해요.
  3. 「텍스트 추출 시작」 클릭 - 첫 추출 시엔 한국어 모델 다운로드(약 15MB) 후 인식 시작. 진행률이 표시됩니다.
  4. 결과 검수 - 빨간 안내문 아래 텍스트 박스에서 직접 수정 가능. 평균 신뢰도 % 도 같이 표시됩니다.
  5. 복사 또는 .txt 다운로드 - 다른 문서·메모로 옮겨서 마무리 정리.

정확도 올리는 팁

  • 사진을 가능한 한 또렷하고 평평하게 찍으세요. 비스듬한 각도는 OCR이 가장 헤매는 케이스입니다.
  • 글자가 작으면 원본 이미지 자체를 크롭하거나 키워서 올리세요. 작은 글씨는 인식 실패율이 높습니다.
  • 스캔본은 흑백·고대비로 변환된 것이 컬러 사진보다 정확도가 높아요.
  • 명함·영수증 같은 짧은 텍스트는 「한국어만」 또는 「영어만」으로 분리해서 돌리면 더 정확합니다.
  • 결과는 항상 원본과 비교해서 검수하세요. 숫자·단위·고유명사는 OCR이 자주 틀립니다.

이 OCR 도구의 특징

  • 한국어 + 영어 동시 인식 - 한 사진 안에 두 언어 섞여 있어도 OK.
  • 브라우저 wasm 처리 - Tesseract.js 오픈소스 엔진을 직접 돌립니다.
  • 결과 직접 수정 - 텍스트 박스에서 바로 고친 후 복사·다운로드.
  • 신뢰도 표시 - 평균 신뢰도 % 로 추출 품질 한눈에 확인.
  • 검수 안내 - 결과 위에 빨간 안내문으로 「오차 가능」 명시. 그대로 쓰지 마세요.
  • 다양한 언어 모드 - 한국어+영어 동시 / 한국어만 / 영어만 골라서 정확도 ↑.

사진을 텍스트로 옮기는 건 손으로 다 치기 너무 번거로워요

책 사진, 강의 슬라이드 캡처, 영수증, 명함, 손글씨 메모를 텍스트 파일로 옮겨야 할 때 한 글자씩 타이핑하면 시간이 너무 들어요. OCR(Optical Character Recognition - 광학 문자 인식)은 이미지 안 글자를 자동으로 알아내서 텍스트로 박아주는 기술입니다.

이 도구는 한국어와 영어를 동시에 인식하고, Tesseract.js라는 오픈소스 OCR 엔진을 브라우저 wasm으로 돌립니다. 처음 한국어 인식 시 모델 파일(약 15MB)을 한 번 받아두면 다음부터는 빠르게 동작합니다.

이런 경우에 잘 맞아요

  • 강의 슬라이드 캡처 - PPT 캡처에서 본문 텍스트만 빠르게 추출해서 노트로 옮기기
  • 책·논문 스캔 - 종이 문서를 사진 찍어 워드·노션·옵시디언으로 옮기기
  • 영수증·명함 - 비용 정리, 연락처 입력 자동화
  • 스크린샷 텍스트화 - 카톡 화면, 웹페이지 캡처에서 글자만 떼서 정리
  • 손글씨 메모 - 또렷한 인쇄체에 가까운 손글씨라면 어느 정도 인식됩니다

이건 한계가 있어요

  • 흘림 손글씨, 디자인된 폰트(필기체·꾸민 글씨), 비스듬히 찍힌 글자, 작은 글씨, 흐릿한 사진은 정확도가 떨어져요.
  • 표·도표 안 글자는 행/열 구조까진 보존이 안 됩니다 (텍스트만 뽑힘).
  • 한자·일본어·중국어는 이 도구에서 안 다룹니다.

다른 OCR 도구랑 비교

기능FreeToolboxNaver Clova OCRGoogle LensAdobe Acrobat
처리 방식브라우저 wasm서버 AI서버 AI로컬·구독
처리 위치브라우저 안네이버 서버구글 서버로컬
회원가입선택API 키 필요구글 계정구독
한국어 정확도중상매우 우수우수우수
속도10~30초1~3초1~3초5~10초
표·도표 보존안 됨일부

자주 묻는 질문

추출 정확도가 100%가 아닌데 왜요?

OCR은 사진 글자를 「추측」하는 기술이라 100% 정확하지 않습니다. 특히 손글씨, 작은 글씨, 디자인된 폰트, 비스듬히 찍힌 글자는 인식이 어렵습니다. 결과 텍스트는 항상 원본과 비교해서 검수 후 사용하세요. 빨간 안내문이 결과 위에 박혀있는 이유입니다.

Tesseract.js가 뭔가요?

Google이 후원하는 오픈소스 OCR 엔진을 JavaScript wasm으로 포팅한 라이브러리입니다. 이 도구는 그 엔진을 사장님 브라우저 안에서 직접 돌리는 방식이라 별도 로그인 없이 바로 쓰실 수 있어요. 처음 한국어 인식 시 모델 파일(약 15MB)을 받습니다.

한국어 모델 다운로드가 매번 되나요?

처음 한 번만 받습니다 (약 15MB). 같은 브라우저에서 다음 사용 시엔 캐시에서 불러와서 빠르게 시작됩니다. 다른 PC나 시크릿 모드에선 다시 받아요.

한자·일본어·중국어도 되나요?

이 도구는 한국어 + 영어만 다룹니다. 다국어 OCR이 필요하면 네이버 클로바 OCR 또는 Google Lens 같은 서버 기반 도구를 권장합니다.

PDF 파일도 OCR 가능한가요?

이 도구는 이미지 파일(JPG·PNG·WebP·GIF)만 받습니다. PDF는 캡처 도구로 페이지를 이미지로 만든 후 올려주세요. 또는 PDF 합치기·분할 도구로 페이지를 분리한 후 페이지마다 이미지로 변환해서 처리하시면 됩니다.

표 안 글자도 추출되나요?

표 안 글자는 텍스트로 뽑히지만 행/열 구조는 보존되지 않습니다. 단순히 한 줄씩 늘어선 텍스트로 나옵니다. 표 형태로 옮기려면 추출 후 직접 정리하셔야 해요.