Detector de Codificación de Archivos
Archivo
Cuando un archivo aparece con mojibake (괆쒋쀎), el primer paso es averiguar qué codificación realmente es. Este detector lee los bytes del archivo en tu navegador (nunca se sube) y corre las heurísticas estándar: secuencias de bytes BOM primero (FF FE para UTF-16 LE, EF BB BF para UTF-8 BOM, etc.), luego densidad de bytes null (UTF-16 tiene nulls en cada otro byte para contenido ASCII), luego verificación de validez UTF-8 (la mayoría de secuencias multi-byte son inválidas en Latin-1, así que UTF-8 válido = muy probablemente UTF-8). Devuelve la codificación detectada, porcentaje de confianza, bytes BOM si están presentes, y una vista lado a lado hex/texto para verificación visual del decode.
Cómo usar
- Suelta o elige cualquier archivo de texto. La detección corre en tu navegador — el archivo nunca deja la página.
- Revisa el panel BOM primero: un BOM significa que la codificación es esencialmente certera. Sin BOM significa detección heurística.
- Compara la vista hex con la vista previa de texto decodificado. Si caracteres no-ASCII se ven bien, la detección es correcta.
Preguntas frecuentes
- ¿Por qué no hay una librería 'detect' como chardet?
- Los navegadores no traen chardet, e importar una librería grande de detección de codificación (el port JS de `CharsetDetector` de ICU es ~200KB) para unos pocos casos comunes es excesivo. Esta herramienta cubre el caso 95%: BOMs, solo-ASCII, UTF-8 válido, y UTF-16 por patrón de bytes null. Para codificaciones asiáticas exóticas (Shift_JIS, GB2312, EUC-KR) sin BOM, necesitarás chardet — pero esta herramienta te dirá 'no es UTF-8' para que sepas buscar en otro lado.
- ¿Qué es el asunto con los BOMs?
- Byte Order Marks son prefijos de 2-4 bytes que marcan explícitamente la codificación. UTF-8 BOM es `EF BB BF` (técnicamente innecesario, controvertido — Microsoft los añade, herramientas Unix usualmente los quitan). BOMs UTF-16/32 (`FF FE` etc.) son útiles porque también señalan endianness. Si un archivo tiene un BOM, confía en él absolutamente.
Herramientas relacionadas
Conversor Imágenes → PDF
Combina varias imágenes JPG / PNG en un solo PDF con tamaño, orientación y ajuste configurables.
Inspector de ZIP
Suelta un ZIP y mira cada archivo dentro — tamaños, contenido y descarga individual — sin desempaquetar localmente.
Divisor de Archivos
Divide un archivo grande en trozos para esquivar límites de adjuntos o subidas.
Conversor de Codificación de Texto
Abre archivos en codificaciones heredadas (EUC-KR, Shift_JIS, Windows-1252…) como UTF-8 legible.
Hash de Archivo (Suma de Verificación)
Calcula las sumas SHA-1, SHA-256 y SHA-512 de cualquier archivo.
Conversor CSV ↔ JSON
Convierte CSV a JSON y JSON a CSV, con opción de delimitador.