Normalizador Unicode (NFC, NFD, NFKC, NFKD)
Texto
El mismo texto visible puede guardarse como secuencias de puntos de código distintas — é puede ser un carácter precompuesto (U+00E9) o 'e' más un acento combinante (U+0065 U+0301). La normalización Unicode reescribe el texto en una forma canónica para que cadenas iguales a la vista se comparen iguales, se ordenen de forma predecible y sobrevivan al paso por sistemas de archivos y bases de datos. NFC compone a la forma precompuesta más corta (la mejor por defecto para almacenamiento y la web); NFD descompone por completo (común en nombres de archivo de macOS); NFKC y NFKD aplican además mapeos de compatibilidad, plegando ligaduras (fi → fi), caracteres de ancho completo (2024 → 2024) y formas como números romanos (Ⅻ → XII). Opcionalmente quita marcas combinantes para eliminar acentos por completo. La tabla de comparación muestra la longitud en puntos de código y bytes UTF-8 de cada forma e indica con cuál coincide ya tu entrada — útil para detectar datos NFD donde esperabas NFC. Todo corre localmente; tu texto nunca sale del navegador.
Salida normalizada · 17 caracteres · 32 bytes
Café file 2024 Ⅻ ①
La entrada ya está en NFC.
Comparación de todas las formas
| Forma | caracteres | bytes | = entrada? |
|---|---|---|---|
| NFC | 17 | 32 | sí |
| NFD | 18 | 33 | no |
| NFKC | 20 | 21 | no |
| NFKD | 21 | 22 | no |
NFC es el valor por defecto más seguro para almacenamiento y la web. NFKC/NFKD y quitar diacríticos tienen pérdida — no los uses en texto que deba quedar exacto.
Cómo usar
- Pega o escribe texto en el cuadro de entrada.
- Elige una forma objetivo (NFC, NFD, NFKC, NFKD) y copia la salida normalizada.
- Activa 'Quitar diacríticos' para eliminar acentos, y lee la tabla para ver en qué forma ya está tu entrada.
Preguntas frecuentes
- ¿Qué forma debo usar?
- NFC es el valor por defecto más seguro para almacenamiento, transporte y la web — es la forma canónica más corta y la que esperan la mayoría de sistemas. Usa NFD cuando un sistema requiera texto descompuesto (p. ej. algunos contextos de macOS). Usa NFKC/NFKD solo cuando quieras deliberadamente el plegado de compatibilidad (ligaduras, ancho completo, super/subíndices colapsados), ya que son transformaciones con pérdida.
- ¿Qué hace 'quitar diacríticos'?
- Descompone el texto (NFD), elimina todas las marcas combinantes y luego renormaliza a la forma elegida — así 'café' pasa a 'cafe' y 'Crème Brûlée' a 'Creme Brulee'. Es útil para crear slugs ASCII o claves de búsqueda sin acentos, pero cambia el significado en muchos idiomas, así que no lo uses en texto que debas mantener correcto.
- ¿Por qué difieren los conteos de bytes entre formas?
- Las formas descompuestas (NFD/NFKD) suelen usar más puntos de código — una 'é' precompuesta es un carácter de 2 bytes en UTF-8, mientras que 'e' + acento combinante son dos caracteres que suman 3 bytes. Las formas de compatibilidad pueden ir en cualquier sentido. La tabla te deja comparar longitudes exactas.
- ¿Es reversible la normalización?
- NFC ↔ NFD preserva información y es reversible para la equivalencia canónica. NFKC/NFKD no son reversibles — una vez plegada una ligadura o un dígito de ancho completo, se pierde la distinción original. Quitar diacríticos también es de un solo sentido.
Herramientas relacionadas
Conversor de tabla Markdown a CSV
Convierte una tabla Markdown estilo GitHub en CSV, TSV o filas separadas por punto y coma, en tu navegador.
Generador de Tablas Markdown
Pega CSV, TSV o datos delimitados por pipe y obtén una tabla GFM correctamente alineada.
Visor de Diferencias de Texto
Compara dos textos y ve adiciones y eliminaciones línea por línea o palabra por palabra.
Generador de Lorem Ipsum
Genera texto de relleno por párrafos, frases o palabras.
Conversor de Mayúsculas
Convierte texto entre MAYÚSCULAS, minúsculas, Título, camelCase y más.
Contador de Caracteres y Palabras
Cuenta caracteres, palabras, frases, líneas y bytes en tiempo real.