Question 1

O que causa mojibake?

Accepted Answer

Acontece quando texto salvo como UTF-8 é lido depois com outra codificação de byte único — quase sempre Windows-1252 ou ISO-8859-1. Cada caractere não ASCII foi salvo como dois ou mais bytes UTF-8, e ler esses bytes um a um produz os caracteres errados: é (dois bytes) aparece como os dois caracteres Ã©. Importações CSV, migrações de banco de dados e copiar-colar entre sistemas incompatíveis são culpados comuns.

Question 2

Vai danificar texto que já está correto?

Accepted Answer

Não. A reparação só tem sucesso quando os bytes revertidos formam UTF-8 válido, o que o mojibake real faz mas o texto bem codificado não. Então 'café', 'Köln', '한국어' ou '日本語' que já estão certos são detectados como válidos e deixados exatamente como estão — a ferramenta informa que nenhum reparo era necessário.

Question 3

Por que às vezes aplica mais de uma passagem?

Accepted Answer

Se o texto foi mal decodificado duas vezes — por exemplo UTF-8 lido como Windows-1252, salvo e lido de novo como Windows-1252 — o estrago se acumula em camadas. A ferramenta repete a reparação até o texto parar de mudar ou não reverter mais para UTF-8 válido, e diz quantas passagens usou.

Question 4

Não corrigiu meu texto — por quê?

Accepted Answer

Ou o texto já está correto, ou a corrupção não é do tipo comum UTF-8-como-Windows-1252 (por exemplo foi mal decodificado como Shift_JIS ou EUC-KR, ou bytes foram realmente perdidos). Esta ferramenta foca no caso mais frequente; para abrir um arquivo em uma codificação herdada específica, use um conversor de codificação de texto.

Reparador de Mojibake (UTF-8 corrompido)

Como usar

Perguntas frequentes

Ferramentas relacionadas

Conversor de tabela Markdown para CSV

Gerador de Tabelas Markdown

Visualizador de Diferenças de Texto

Gerador de Lorem Ipsum

Conversor de Maiúsculas

Contador de Caracteres e Palavras