utilbox
개발자

텍스트 인코딩 감지기

파일을 업로드하면 BOM과 휴리스틱으로 인코딩을 자동 감지하고, 다른 인코딩으로 디코딩 미리보기를 제공합니다.

파일을 드래그하거나 클릭해서 선택하세요

텍스트 파일 (.txt, .csv, .log, .md, .json 등) · 최대 5MB

사용 방법

  1. 인코딩이 궁금한 텍스트 파일을 업로드합니다 (드래그 앤 드롭 가능).
  2. BOM(바이트 순서 표식)이 있으면 즉시 식별합니다 (UTF-8/UTF-16 등).
  3. BOM이 없으면 UTF-8 유효성 검사와 EUC-KR/CP949 패턴 휴리스틱으로 판별합니다.
  4. 오른쪽 드롭다운에서 다른 인코딩으로 디코딩 결과를 확인할 수 있습니다.
  5. 파일 처리는 모두 브라우저에서 이뤄지며 서버로 전송되지 않습니다.

자주 만나는 한글 인코딩

UTF-8

현대 표준. 한 글자가 3바이트(한글). 최근 거의 모든 환경의 기본값.

EUC-KR / CP949

윈도우 한글 메모장이 오래 쓰던 인코딩. 한 글자가 2바이트. CSV가 깨질 때 의심.

UTF-16

주로 윈도우 시스템 파일·Excel xml에서 등장. BOM이 거의 항상 붙어 있음.