1
PDF 텍스트 추출
단독 페이지PDF 본문 텍스트를 페이지 범위·구분선·단락 옵션과 함께 추출합니다. 텍스트 레이어가 있는 PDF만 지원하며, 스캔된 이미지 PDF는 OCR이 필요합니다.
입력PDF출력텍스트
PDF에서 본문을 뽑아 헤딩 구조로 목차를 자동 추출.
워크스페이스 캔버스는 데스크톱 전용입니다. 아래 도구 카드의 단독 사용 링크로 모바일에서도 개별 도구를 사용할 수 있습니다.
전자책·기술문서·매뉴얼 PDF의 챕터 구조를 한눈에 보고 싶을 때, 본문을 텍스트로 추출한 뒤 마크다운 목차 생성기에 넘겨 헤딩 구조를 뽑아내는 흐름입니다. PDF 텍스트 추출이 본문을 일반 텍스트로 변환하고, 마크다운 목차 생성기가 마크다운 형식의 헤딩(`#`, `##` 등)을 인식해 자동으로 목차를 만듭니다.
주의: 이 흐름은 본문에 마크다운 헤딩 표기가 있거나, 사용자가 추출 결과에서 챕터 제목 앞에 `#`을 붙여 가공한 경우에 가장 잘 작동합니다. 일반 PDF 본문에는 헤딩 마크가 없으니 추출 결과를 한 번 손보고 목차 도구로 보내는 패턴을 권장합니다.