Question 1

¿Qué causa el mojibake?

Accepted Answer

Ocurre cuando texto guardado como UTF-8 se lee después con otra codificación de un solo byte — casi siempre Windows-1252 o ISO-8859-1. Cada carácter no ASCII se guardó como dos o más bytes UTF-8, y leer esos bytes de uno en uno produce los caracteres equivocados: é (dos bytes) aparece como los dos caracteres Ã©. Importaciones CSV, migraciones de bases de datos y copiar-pegar entre sistemas dispares son causas comunes.

Question 2

¿Dañará texto que ya está correcto?

Accepted Answer

No. La reparación solo tiene éxito cuando los bytes revertidos forman UTF-8 válido, cosa que el mojibake real sí hace pero el texto bien codificado no. Así que 'café', 'Köln', '한국어' o '日本語' que ya están bien se detectan como válidos y se dejan exactamente como están — la herramienta informa de que no hacía falta arreglo.

Question 3

¿Por qué a veces aplica más de una pasada?

Accepted Answer

Si el texto se decodificó mal dos veces — por ejemplo UTF-8 leído como Windows-1252, guardado y leído de nuevo como Windows-1252 — el estropicio se acumula en capas. La herramienta repite la reparación hasta que el texto deja de cambiar o ya no se revierte a UTF-8 válido, y te dice cuántas pasadas usó.

Question 4

No arregló mi texto — ¿por qué?

Accepted Answer

O el texto ya está correcto, o la corrupción no es del tipo común UTF-8-como-Windows-1252 (por ejemplo se decodificó mal como Shift_JIS o EUC-KR, o se perdieron bytes). Esta herramienta apunta al caso más frecuente; para abrir un archivo en una codificación heredada concreta, usa un convertidor de codificación de texto.

Reparador de Mojibake (UTF-8 corrupto)

Cómo usar

Preguntas frecuentes

Herramientas relacionadas

Conversor de tabla Markdown a CSV

Generador de Tablas Markdown

Visor de Diferencias de Texto

Generador de Lorem Ipsum

Conversor de Mayúsculas

Contador de Caracteres y Palabras