Question 1

chardet 같은 '감지' 라이브러리 왜 없나?

Accepted Answer

브라우저는 chardet 안 갖춤, 일부 흔한 경우 위해 큰 인코딩 감지 라이브러리(ICU `CharsetDetector` JS 포트는 ~200KB) 임포트는 과함. 이 툴은 95% 경우 커버: BOM·ASCII만·유효 UTF-8·널 바이트 패턴으로 UTF-16. BOM 없는 이국적 아시아 인코딩(Shift_JIS·GB2312·EUC-KR)엔 chardet 필요 — 단 이 툴은 'UTF-8 아님'은 알려줘서 다른 곳 찾을 줄 알게 함.

Question 2

BOM이란 뭔가?

Accepted Answer

Byte Order Mark는 인코딩을 명시적으로 표시하는 2-4 바이트 프리픽스. UTF-8 BOM은 `EF BB BF`(기술적 불필요, 논쟁적 — Microsoft 추가, Unix 도구는 보통 제거). UTF-16/32 BOM(`FF FE` 등)은 엔디언도 신호하기에 유용. 파일에 BOM 있으면 절대 신뢰.

파일 인코딩 감지기

사용법

자주 묻는 질문

관련 도구

이미지 → PDF 변환

ZIP 내용 보기

파일 분할기

텍스트 인코딩 변환기

파일 해시 (체크섬)

CSV ↔ JSON 변환기