Question 1

Mojibake는 왜 생기나요?

Accepted Answer

UTF-8로 저장된 텍스트를 나중에 다른 단일 바이트 인코딩 — 흔히 Windows-1252나 ISO-8859-1 — 으로 읽을 때 발생합니다. 각 비ASCII 문자는 둘 이상의 UTF-8 바이트로 저장됐는데 그 바이트를 하나씩 읽으면 잘못된 문자가 나옵니다: é(2바이트)는 두 문자 Ã©로 보입니다. CSV 가져오기, 데이터베이스 마이그레이션, 인코딩이 다른 시스템 간 복사·붙여넣기가 흔한 원인입니다.

Question 2

이미 올바른 텍스트를 손상시키나요?

Accepted Answer

아니요. 복구는 되돌린 바이트가 유효한 UTF-8을 이룰 때만 성공하는데, 진짜 mojibake는 그렇지만 올바르게 인코딩된 텍스트는 아닙니다. 그래서 이미 올바른 'café', 'Köln', '한국어', '日本語'는 유효한 것으로 감지되어 그대로 둡니다 — 도구가 수정이 필요 없다고 알려 줍니다.

Question 3

왜 가끔 두 번 이상 패스를 적용하나요?

Accepted Answer

텍스트가 두 번 잘못 디코딩됐다면 — 예를 들어 UTF-8을 Windows-1252로 읽고 저장한 뒤 다시 Windows-1252로 읽으면 — 깨짐이 겹쳐집니다. 도구는 텍스트가 더 이상 바뀌지 않거나 유효한 UTF-8로 되돌려지지 않을 때까지 복구를 반복하고 몇 번의 패스를 썼는지 알려 줍니다.

Question 4

텍스트가 안 고쳐졌어요 — 왜죠?

Accepted Answer

텍스트가 이미 올바르거나, 손상이 흔한 UTF-8-을-Windows-1252로-읽은 종류가 아니기 때문입니다(예: Shift_JIS나 EUC-KR로 잘못 디코딩됐거나 바이트가 실제로 손실됨). 이 도구는 가장 빈번한 경우를 다룹니다. 특정 레거시 인코딩으로 파일을 열려면 텍스트 인코딩 변환기를 쓰세요.

Mojibake 복구 (깨진 UTF-8 수리)

사용법

자주 묻는 질문

관련 도구

Markdown 표 → CSV 변환기

마크다운 표 생성기

텍스트 Diff 뷰어

Lorem Ipsum 생성기

대소문자 변환기

글자수 단어수 카운터