PDF 글자추출 3초만에 하기(PDFOCR)
문서 보실때 편하게 PDF로 많이들 보실거에요.
그런데 가끔 보는 것 말고도 문서 내용을
추출해서 사용해야 하는 경우가 생기기 마련입니다.
PDF에 나온 내용를 가져다가 본인이 작성하는
문서에 참고로 쓰고 싶은 경우들이 대표적입니다.
글자 이미지를 수정 가능한 텍스트로 변환(PDFOCR)
우리가 사용하는 문자들 한글, 영어 모두
컴퓨터는 모두 0과1로 된 숫자로 인식하고
있다는 사실 알고계신가요?
“가”라는 문자도 0101000같이 특수한 문자로
되어 있어야 컴퓨터가 “가”로 이해하고 읽습니다
그런데 이미 글자가 그림으로 되어 있는
PDF 파일은 컴퓨터가 기존의 방식으로 읽을 수 없습니다.
따라서 pdf파일에 든 글자는 글이긴 하지만
PDF를 읽을 수 있는 프로그램(adobe)이 없으면
임의로 수정이 불가능합니다.
그러나 그런 프로그램 없이도
PDF 글자를 컴퓨터가 읽을 수 있는 text문자로
바꾸어주는 기술이 바로 PDFOCR 입니다.
오늘 소개해 드리는 각종 온라인 페이지와
전문 프로그램들 모두 이 PDFOCR 기술을
기반으로 하고 있습니다.
PDF 글자추출 하는 법
그래서 오늘 여러분에게 PDF 문서에서
글자 추출하는 방법(PDFOCR)에 대해
상세히 설명하고자 합니다.
이 방법은 누구나 쉽게 따라 할 수 있으며,
사실 학생뿐만 아니라
타인의 문서나 글을
많이 참조 해야하는 직장인이라면
효율적인 업무를 위해
반드시 알아두어야 하는
필수 스킬이 될 수 있습니다.
PDF를 이용해서 글자를 추출하는 방법은
크게 2가지로 나뉨니다.
하나는 온라인 웹사이트에서
무료로 제공하는 툴을 사용하는 방법
또 다른 방법은 전문 프로그램을
이용하는 방법입니다.
서로 사용하는 목적이 다릅니다.
이유는 조금 있다가 바로 뒤에서
설명 드리겠습니다.
먼저 온라인 웹사이트를 이용해서
PDF를 텍스트로 추출하는 방법부터
설명 드리겠습니다.
1. PDF 글자추출 사이트를 이용하는 방법
가장 대표적이고 편하게
PDF 글자추출을 하는 방법은 바로
PDF 글자추출 사이트를
이용하는 방법입니다.
온라인 글자 추출 사이트를 추천하는
가장 큰 이유는 가장 접근성이 쉽고
사용하기 편하며, 궂이 불필요한
프로그램을 깔 필요도 없기 때문입니다.
게다가 엄청나게 많은 양의
PDF를 텍스트로 추출할 것이 아니라면
기능을 무료로 사용 가능합니다.
글자 추출을 위해서 전문 프로그램을
사용하면 강력한 기능을 제공하기 때문에
좋은 선택이 될 수 있지만
종종 나쁜 목적을 가진 배포자가 뿌린
프로그램을 잘 못 다운 받아 사용하게 되면
컴퓨터 좀비화 , 개인정보 탈취, 바이러스 감염등
심각한 문제를 초래 할 수 있습니다.
그러나 검증된 온라인 사이트에서
PDF 글자추출 기능을 사용하면
이러한 위험에 노출되지 않도고 쉽고
빠르게 텍스트를 추출 할 수 있기 때문에
추천하는 방법입니다.
저는 검증되고 안전한 사이트
2곳을 추천드리겠습니다.
사용하는 방법 또한 매우 간단하고 쉽습니다.
그냥 특정 웹사이트에 들어가서
문서에서 텍스트를 추출 기능을 사용하기
위해서 마우스로 버튼을 몇 번 누르는 것이
전부 입니다.
PDF 텍스트 추출이 가능한 사이트는 다음과 같습니다.
1. pdfcandy.com 가서 글자 추출하기
무료로 쉽게 pdf 텍스트 추출이 가능한
사이트입니다.
아래 링크로 가셔서
pdf 글자 인식이 필요한 파일을
업로드 하기만 하면
자동으로 알아서 인식이 가능한
텍스트 형태로 문서를 다운 받을 수 있습니다
다운 받은 파일의 형식은
텍스트(TXT)파일 형태이며
그림으로 된 문자는 인식되지 않습니다.
2. avePDF
또 다른 온라인 pdf 텍스트 추출 사이트는
바로 avePDF 입니다.
이 사이트 역시 앞서 소개드린
PDFcandy와 비슷한 성격의 사이트입니다.
AvePDF 문자 추출 역시 아래의 링크를 통해서
AvePDF 사이트에 접속한 후에
텍스트로 추출하고 싶은 PDF 파일을
업로드 하기만 하면 됩니다.
pdf 텍스트 추출 전문 프로그램
앞서 소개해 드린 PDF 문자추출 사이트를
이용해 보신분들 중에 느낀 분도 계시겠지만
PDF 에서 텍스트 파일을 추출하다보면
텍스트 추출이 생각보다 만족스럽지 않은
경우가 종종 발생합니다.
텍스트 추출이 정확하지 않아
오타가 있거나 알아볼 수 없는 형태로
추출되거나 일부 텍스트 추출이 안 되는
경우도 꽤 종종 발생합니다
사이트에서 무료로 제공하는 기능이다 보니
기능이 생각보다 만족스럽지 못한 것입니다.
퀄리티 높은 PDF 글자추출을 원한다면?
이런 경우 무료 툴을 사용하기 보다
전문 프로그램을 다운받아 사용하면
PDF 글자 추출 퀄리티를 높일 수 있습니다.
PDF 텍스트 추출 추천 프로그램들
다운 가능한 전문 프로그램들은
다음과 같습니다.
전부 무료로 사용이 가능합니다.
1.ezPDF Editor / EaseUS PDF Editor
대표적인 PDF 글자추출 기능을 제공하는
프로그램으로는
가 있습니다.
둘다 무료로 다운 받아
사용할 수 있습니다.
PDFOCR 기능도 무료로 사용 가능합니다
다만,일부 기능은 유료입니다.
ezPDF Editor 다운로드 바로가기
EaseUS PDF Editor 다운로드 바로가기
2.Adobe Acrobat 사용하기
Adobe Acrobat은 PDF 문서를 열고
편집할 수 있는
매우 강력하고 유용한 툴입니다.
애시당초 PDF 라는 포멧 자체가
Adobe 사로부터 나온 것이기 때문에
PDF와 관련된 원천기술은 전부
Adobe에서 시작되었다고 해도 과언이
아니기 때문입니다.
특히 adobe acrobat의 경우에는
PDF 파일의 텍스트 추출은 물론,
PDF 내용의 수정까지 모두 완력하게
할 수 있습니다.
이 프로그램을 사용하면
PDF 문서에서 text를 추출하는 것도
매우 쉬워집니다.
Adobe Acrobat에서
텍스트 파일을 추출하는 방법은
다음과 같습니다.
파일을 열고, “도구 상자”에서
“텍스트 인식”을 선택한 다음,
“모든 페이지”를 선택하면
text 추출을 할 수 있습니다.
3. Google Drive 사용하기
요즘에는 크롬을 사용하는분들이
많기 때문에 대부분 구글 계정을
가지고 계신 분들이 많으 실텐에요.
구글 계정을 갖고 있다면
구글에서 무료로 제공하는 구글 드라이브를
통해서도 PDF 문서 글자 추출이 가능합니다.
Google Drive를 사용하면 PDF 문서를
업로드하고 text 추출을
쉽게 할 수 있습니다.
구글 드라이브로 PDF 글자 추출하는법
우선 Google Drive에 로그인을 합니다.
다음에 구글 드라이브에
업로드 버튼을 누르고
PDF 문서를 업로드합니다.
그런 다음, 추출할 PDF 문서를 우클릭을 하면
[연결앱] – [google 문서]를 통해서
문서 열기를 합니다.
그러면 PDF 파일이 text화 된 문서가 나오는데
여기서 왼쪽 상단 메뉴[파일]-[다운로드]
하면 word 형식이나 text 파일로
다운로드가 가능합니다.
그러면 PDF 파일을 text나
word 파일로 다운받을 수 있고
다운로드가 완료되면 Microsoft Word에서
텍스트를 추출할 수 있습니다.
혹은 바로 text 파일로 다운받아서
텍스트를 추출 할 수 도 있습니다.
구글 드라이브를 이용하면
프로그램을 따로 다운 받아서 사용할
필요 없이 그냥 사용이 가능하므로
매우 편리한 방법중 하나입니다.
4. PDF Converter 사용하기
PDF converter는 PDF 파일을 기타
다른 형식의 파일로 변환시키는
툴을 말합니다.
이 도구를 사용하면
PDF 문서에서 text를
추출하는 것도 매우 쉬워집니다.
이 변환기를 사용하면 PDF 파일을
엑셀이나 워드 같은 파일로 변환함과
동시에 텍스트를 추출 할 수 있는
형태로 바뀌게 됩니다.
사용하는 방법은 간단합니다.
PDF Converter를 실행하고,
변환하려는 파일을 선택한 다음,
text 파일로 변환하면 됩니다.
우리는 이러한 방법 중 하나를 사용하여
PDF 문서에서 text를 추출할 수 있습니다.
그러나 이 기술을 사용하여
text를 추출할 때
몇 가지 주의할 점이 있습니다.
특히, 추출된 text를 편집할 때
폰트와 포맷이 유지되는지
확인해야 합니다.
오늘 알려드린 방법들은 PDF 내 글자들을
추출하는데 효과적이지만
대부분 100% 완벽하지 않으며
사용하는 툴에 따라서
글의 폰트와 크기가 달라지는 경우가
대부분이므로
추출 후에 다시 폰트와 글자크기를
조절해야 할 필요가 있습니다.
지금까지 PDF 파일에서 글자를
추출하는 방법에 대해서
알아보았습니다.
아직도 많은 분들이 PDF 파일에서
텍스트를 추출 할 때
유료 프로그램을 사용하거나
혹은 매월 구독료를 결제해서 사용하시는
분들이 많습니다.
오늘 글을 읽으셨다면 더이상 쓸데없이
돈을 쓰는 일이 없으실 겁니다 :)
글이 도움이 되셨다면
아래 댓글,SNS 공유 부탁드립니다.
감사합니다.
Leave A Comment