이미지 OCR (사진에서 글자 추출)

한국어 + 영어 자동 인식. 사진을 올리면 글자만 뽑아서 텍스트로 박아줍니다. 추출 결과는 검수 후 사용해주세요.

이미지를 여기에 드롭하거나 클릭하여 선택

JPG, PNG, WebP, GIF 지원 - 글자가 또렷한 이미지일수록 정확도가 높습니다

쓰는 법

이미지 업로드 - 드래그하거나 클릭해서 선택. JPG·PNG·WebP·GIF 다 됩니다.
인식 언어 선택 - 기본은 「한국어 + 영어」 동시 인식. 영어만 있으면 「영어만」을 골라야 더 빠르고 정확해요.
「텍스트 추출 시작」 클릭 - 첫 추출 시엔 한국어 모델 다운로드(약 15MB) 후 인식 시작. 진행률이 표시됩니다.
결과 검수 - 빨간 안내문 아래 텍스트 박스에서 직접 수정 가능. 평균 신뢰도 % 도 같이 표시됩니다.
복사 또는 .txt 다운로드 - 다른 문서·메모로 옮겨서 마무리 정리.

정확도 올리는 팁

사진을 가능한 한 또렷하고 평평하게 찍으세요. 비스듬한 각도는 OCR이 가장 헤매는 케이스입니다.
글자가 작으면 원본 이미지 자체를 크롭하거나 키워서 올리세요. 작은 글씨는 인식 실패율이 높습니다.
스캔본은 흑백·고대비로 변환된 것이 컬러 사진보다 정확도가 높아요.
명함·영수증 같은 짧은 텍스트는 「한국어만」 또는 「영어만」으로 분리해서 돌리면 더 정확합니다.
결과는 항상 원본과 비교해서 검수하세요. 숫자·단위·고유명사는 OCR이 자주 틀립니다.

이 OCR 도구의 특징

한국어 + 영어 동시 인식 - 한 사진 안에 두 언어 섞여 있어도 OK.
브라우저 wasm 처리 - Tesseract.js 오픈소스 엔진을 직접 돌립니다.
결과 직접 수정 - 텍스트 박스에서 바로 고친 후 복사·다운로드.
신뢰도 표시 - 평균 신뢰도 % 로 추출 품질 한눈에 확인.
검수 안내 - 결과 위에 빨간 안내문으로 「오차 가능」 명시. 그대로 쓰지 마세요.
다양한 언어 모드 - 한국어+영어 동시 / 한국어만 / 영어만 골라서 정확도 ↑.

사진을 텍스트로 옮기는 건 손으로 다 치기 너무 번거로워요

책 사진, 강의 슬라이드 캡처, 영수증, 명함, 손글씨 메모를 텍스트 파일로 옮겨야 할 때 한 글자씩 타이핑하면 시간이 너무 들어요. OCR(Optical Character Recognition - 광학 문자 인식)은 이미지 안 글자를 자동으로 알아내서 텍스트로 박아주는 기술입니다.

이 도구는 한국어와 영어를 동시에 인식하고, Tesseract.js라는 오픈소스 OCR 엔진을 브라우저 wasm으로 돌립니다. 처음 한국어 인식 시 모델 파일(약 15MB)을 한 번 받아두면 다음부터는 빠르게 동작합니다.

이런 경우에 잘 맞아요

강의 슬라이드 캡처 - PPT 캡처에서 본문 텍스트만 빠르게 추출해서 노트로 옮기기
책·논문 스캔 - 종이 문서를 사진 찍어 워드·노션·옵시디언으로 옮기기
영수증·명함 - 비용 정리, 연락처 입력 자동화
스크린샷 텍스트화 - 카톡 화면, 웹페이지 캡처에서 글자만 떼서 정리
손글씨 메모 - 또렷한 인쇄체에 가까운 손글씨라면 어느 정도 인식됩니다

이건 한계가 있어요

흘림 손글씨, 디자인된 폰트(필기체·꾸민 글씨), 비스듬히 찍힌 글자, 작은 글씨, 흐릿한 사진은 정확도가 떨어져요.
표·도표 안 글자는 행/열 구조까진 보존이 안 됩니다 (텍스트만 뽑힘).
한자·일본어·중국어는 이 도구에서 안 다룹니다.

다른 OCR 도구랑 비교

기능	FreeToolbox	Naver Clova OCR	Google Lens	Adobe Acrobat
처리 방식	브라우저 wasm	서버 AI	서버 AI	로컬·구독
처리 위치	브라우저 안	네이버 서버	구글 서버	로컬
회원가입	선택	API 키 필요	구글 계정	구독
한국어 정확도	중상	매우 우수	우수	우수
속도	10~30초	1~3초	1~3초	5~10초
표·도표 보존	안 됨	됨	일부	됨

자주 묻는 질문

추출 정확도가 100%가 아닌데 왜요?

OCR은 사진 글자를 「추측」하는 기술이라 100% 정확하지 않습니다. 특히 손글씨, 작은 글씨, 디자인된 폰트, 비스듬히 찍힌 글자는 인식이 어렵습니다. 결과 텍스트는 항상 원본과 비교해서 검수 후 사용하세요. 빨간 안내문이 결과 위에 박혀있는 이유입니다.

Tesseract.js가 뭔가요?

Google이 후원하는 오픈소스 OCR 엔진을 JavaScript wasm으로 포팅한 라이브러리입니다. 이 도구는 그 엔진을 사장님 브라우저 안에서 직접 돌리는 방식이라 별도 로그인 없이 바로 쓰실 수 있어요. 처음 한국어 인식 시 모델 파일(약 15MB)을 받습니다.

한국어 모델 다운로드가 매번 되나요?

처음 한 번만 받습니다 (약 15MB). 같은 브라우저에서 다음 사용 시엔 캐시에서 불러와서 빠르게 시작됩니다. 다른 PC나 시크릿 모드에선 다시 받아요.

한자·일본어·중국어도 되나요?

이 도구는 한국어 + 영어만 다룹니다. 다국어 OCR이 필요하면 네이버 클로바 OCR 또는 Google Lens 같은 서버 기반 도구를 권장합니다.

PDF 파일도 OCR 가능한가요?

이 도구는 이미지 파일(JPG·PNG·WebP·GIF)만 받습니다. PDF는 캡처 도구로 페이지를 이미지로 만든 후 올려주세요. 또는 PDF 합치기·분할 도구로 페이지를 분리한 후 페이지마다 이미지로 변환해서 처리하시면 됩니다.

표 안 글자도 추출되나요?

표 안 글자는 텍스트로 뽑히지만 행/열 구조는 보존되지 않습니다. 단순히 한 줄씩 늘어선 텍스트로 나옵니다. 표 형태로 옮기려면 추출 후 직접 정리하셔야 해요.