이미지 OCR (사진에서 글자 추출)
한국어 + 영어 자동 인식. 사진을 올리면 글자만 뽑아서 텍스트로 박아줍니다. 추출 결과는 검수 후 사용해주세요.
이미지를 여기에 드롭하거나 클릭하여 선택
JPG, PNG, WebP, GIF 지원 - 글자가 또렷한 이미지일수록 정확도가 높습니다
쓰는 법
- 이미지 업로드 - 드래그하거나 클릭해서 선택. JPG·PNG·WebP·GIF 다 됩니다.
- 인식 언어 선택 - 기본은 「한국어 + 영어」 동시 인식. 영어만 있으면 「영어만」을 골라야 더 빠르고 정확해요.
- 「텍스트 추출 시작」 클릭 - 첫 추출 시엔 한국어 모델 다운로드(약 15MB) 후 인식 시작. 진행률이 표시됩니다.
- 결과 검수 - 빨간 안내문 아래 텍스트 박스에서 직접 수정 가능. 평균 신뢰도 % 도 같이 표시됩니다.
- 복사 또는 .txt 다운로드 - 다른 문서·메모로 옮겨서 마무리 정리.
정확도 올리는 팁
- 사진을 가능한 한 또렷하고 평평하게 찍으세요. 비스듬한 각도는 OCR이 가장 헤매는 케이스입니다.
- 글자가 작으면 원본 이미지 자체를 크롭하거나 키워서 올리세요. 작은 글씨는 인식 실패율이 높습니다.
- 스캔본은 흑백·고대비로 변환된 것이 컬러 사진보다 정확도가 높아요.
- 명함·영수증 같은 짧은 텍스트는 「한국어만」 또는 「영어만」으로 분리해서 돌리면 더 정확합니다.
- 결과는 항상 원본과 비교해서 검수하세요. 숫자·단위·고유명사는 OCR이 자주 틀립니다.
이 OCR 도구의 특징
- 한국어 + 영어 동시 인식 - 한 사진 안에 두 언어 섞여 있어도 OK.
- 브라우저 wasm 처리 - Tesseract.js 오픈소스 엔진을 직접 돌립니다.
- 결과 직접 수정 - 텍스트 박스에서 바로 고친 후 복사·다운로드.
- 신뢰도 표시 - 평균 신뢰도 % 로 추출 품질 한눈에 확인.
- 검수 안내 - 결과 위에 빨간 안내문으로 「오차 가능」 명시. 그대로 쓰지 마세요.
- 다양한 언어 모드 - 한국어+영어 동시 / 한국어만 / 영어만 골라서 정확도 ↑.
사진을 텍스트로 옮기는 건 손으로 다 치기 너무 번거로워요
책 사진, 강의 슬라이드 캡처, 영수증, 명함, 손글씨 메모를 텍스트 파일로 옮겨야 할 때 한 글자씩 타이핑하면 시간이 너무 들어요. OCR(Optical Character Recognition - 광학 문자 인식)은 이미지 안 글자를 자동으로 알아내서 텍스트로 박아주는 기술입니다.
이 도구는 한국어와 영어를 동시에 인식하고, Tesseract.js라는 오픈소스 OCR 엔진을 브라우저 wasm으로 돌립니다. 처음 한국어 인식 시 모델 파일(약 15MB)을 한 번 받아두면 다음부터는 빠르게 동작합니다.
이런 경우에 잘 맞아요
- 강의 슬라이드 캡처 - PPT 캡처에서 본문 텍스트만 빠르게 추출해서 노트로 옮기기
- 책·논문 스캔 - 종이 문서를 사진 찍어 워드·노션·옵시디언으로 옮기기
- 영수증·명함 - 비용 정리, 연락처 입력 자동화
- 스크린샷 텍스트화 - 카톡 화면, 웹페이지 캡처에서 글자만 떼서 정리
- 손글씨 메모 - 또렷한 인쇄체에 가까운 손글씨라면 어느 정도 인식됩니다
이건 한계가 있어요
- 흘림 손글씨, 디자인된 폰트(필기체·꾸민 글씨), 비스듬히 찍힌 글자, 작은 글씨, 흐릿한 사진은 정확도가 떨어져요.
- 표·도표 안 글자는 행/열 구조까진 보존이 안 됩니다 (텍스트만 뽑힘).
- 한자·일본어·중국어는 이 도구에서 안 다룹니다.
다른 OCR 도구랑 비교
| 기능 | FreeToolbox | Naver Clova OCR | Google Lens | Adobe Acrobat |
|---|---|---|---|---|
| 처리 방식 | 브라우저 wasm | 서버 AI | 서버 AI | 로컬·구독 |
| 처리 위치 | 브라우저 안 | 네이버 서버 | 구글 서버 | 로컬 |
| 회원가입 | 선택 | API 키 필요 | 구글 계정 | 구독 |
| 한국어 정확도 | 중상 | 매우 우수 | 우수 | 우수 |
| 속도 | 10~30초 | 1~3초 | 1~3초 | 5~10초 |
| 표·도표 보존 | 안 됨 | 됨 | 일부 | 됨 |
자주 묻는 질문
추출 정확도가 100%가 아닌데 왜요?
OCR은 사진 글자를 「추측」하는 기술이라 100% 정확하지 않습니다. 특히 손글씨, 작은 글씨, 디자인된 폰트, 비스듬히 찍힌 글자는 인식이 어렵습니다. 결과 텍스트는 항상 원본과 비교해서 검수 후 사용하세요. 빨간 안내문이 결과 위에 박혀있는 이유입니다.
Tesseract.js가 뭔가요?
Google이 후원하는 오픈소스 OCR 엔진을 JavaScript wasm으로 포팅한 라이브러리입니다. 이 도구는 그 엔진을 사장님 브라우저 안에서 직접 돌리는 방식이라 별도 로그인 없이 바로 쓰실 수 있어요. 처음 한국어 인식 시 모델 파일(약 15MB)을 받습니다.
한국어 모델 다운로드가 매번 되나요?
처음 한 번만 받습니다 (약 15MB). 같은 브라우저에서 다음 사용 시엔 캐시에서 불러와서 빠르게 시작됩니다. 다른 PC나 시크릿 모드에선 다시 받아요.
한자·일본어·중국어도 되나요?
이 도구는 한국어 + 영어만 다룹니다. 다국어 OCR이 필요하면 네이버 클로바 OCR 또는 Google Lens 같은 서버 기반 도구를 권장합니다.
PDF 파일도 OCR 가능한가요?
이 도구는 이미지 파일(JPG·PNG·WebP·GIF)만 받습니다. PDF는 캡처 도구로 페이지를 이미지로 만든 후 올려주세요. 또는 PDF 합치기·분할 도구로 페이지를 분리한 후 페이지마다 이미지로 변환해서 처리하시면 됩니다.
표 안 글자도 추출되나요?
표 안 글자는 텍스트로 뽑히지만 행/열 구조는 보존되지 않습니다. 단순히 한 줄씩 늘어선 텍스트로 나옵니다. 표 형태로 옮기려면 추출 후 직접 정리하셔야 해요.