AZ Tools

Normalizador Unicode (NFC, NFD, NFKC, NFKD)

Texto

El mismo texto visible puede guardarse como secuencias de puntos de código distintas — é puede ser un carácter precompuesto (U+00E9) o 'e' más un acento combinante (U+0065 U+0301). La normalización Unicode reescribe el texto en una forma canónica para que cadenas iguales a la vista se comparen iguales, se ordenen de forma predecible y sobrevivan al paso por sistemas de archivos y bases de datos. NFC compone a la forma precompuesta más corta (la mejor por defecto para almacenamiento y la web); NFD descompone por completo (común en nombres de archivo de macOS); NFKC y NFKD aplican además mapeos de compatibilidad, plegando ligaduras (fi → fi), caracteres de ancho completo (2024 → 2024) y formas como números romanos (Ⅻ → XII). Opcionalmente quita marcas combinantes para eliminar acentos por completo. La tabla de comparación muestra la longitud en puntos de código y bytes UTF-8 de cada forma e indica con cuál coincide ya tu entrada — útil para detectar datos NFD donde esperabas NFC. Todo corre localmente; tu texto nunca sale del navegador.

Salida normalizada · 17 caracteres · 32 bytes

Café file 2024 Ⅻ ①

La entrada ya está en NFC.

Comparación de todas las formas

Formacaracteresbytes= entrada?
NFC1732
NFD1833no
NFKC2021no
NFKD2122no

NFC es el valor por defecto más seguro para almacenamiento y la web. NFKC/NFKD y quitar diacríticos tienen pérdida — no los uses en texto que deba quedar exacto.

Cómo usar

  1. Pega o escribe texto en el cuadro de entrada.
  2. Elige una forma objetivo (NFC, NFD, NFKC, NFKD) y copia la salida normalizada.
  3. Activa 'Quitar diacríticos' para eliminar acentos, y lee la tabla para ver en qué forma ya está tu entrada.

Preguntas frecuentes

¿Qué forma debo usar?
NFC es el valor por defecto más seguro para almacenamiento, transporte y la web — es la forma canónica más corta y la que esperan la mayoría de sistemas. Usa NFD cuando un sistema requiera texto descompuesto (p. ej. algunos contextos de macOS). Usa NFKC/NFKD solo cuando quieras deliberadamente el plegado de compatibilidad (ligaduras, ancho completo, super/subíndices colapsados), ya que son transformaciones con pérdida.
¿Qué hace 'quitar diacríticos'?
Descompone el texto (NFD), elimina todas las marcas combinantes y luego renormaliza a la forma elegida — así 'café' pasa a 'cafe' y 'Crème Brûlée' a 'Creme Brulee'. Es útil para crear slugs ASCII o claves de búsqueda sin acentos, pero cambia el significado en muchos idiomas, así que no lo uses en texto que debas mantener correcto.
¿Por qué difieren los conteos de bytes entre formas?
Las formas descompuestas (NFD/NFKD) suelen usar más puntos de código — una 'é' precompuesta es un carácter de 2 bytes en UTF-8, mientras que 'e' + acento combinante son dos caracteres que suman 3 bytes. Las formas de compatibilidad pueden ir en cualquier sentido. La tabla te deja comparar longitudes exactas.
¿Es reversible la normalización?
NFC ↔ NFD preserva información y es reversible para la equivalencia canónica. NFKC/NFKD no son reversibles — una vez plegada una ligadura o un dígito de ancho completo, se pierde la distinción original. Quitar diacríticos también es de un solo sentido.

Herramientas relacionadas