AZ Tools

Validador e inspector de sitemap.xml

Red

Valida un sitemap `<urlset>` o un `<sitemapindex>` contra el protocolo Sitemaps 0.9 que usan Google, Bing y los demás motores principales. Detecta el elemento raíz automáticamente y comprueba: recuento de URLs/sitemaps frente al límite de 50 000 por archivo; tamaño sin comprimir frente al límite de 50 MB; URLs absolutas http/https; `<loc>` ≤ 2048 caracteres; `changefreq` ∈ {always, hourly, daily, weekly, monthly, yearly, never}; `priority` en [0.0, 1.0]; `lastmod` como W3C / ISO 8601 válido y no futuro; y avisa de `<loc>` duplicados. Para `<urlset>` también desglosa la distribución de changefreq, buckets de priority y nombre de host para detectar errores típicos (todo en priority 1.0 — Google lo desaconseja explícitamente, o un sitemap mezclando dos hosts).

Aún nada — pega, suelta o carga un sitemap.xml para empezar.

Valida contra Sitemaps 0.9 (sitemaps.org). Límites: 50 000 URLs por sitemap, 50 MB sin comprimir, 2048 caracteres por <loc>. Los índices admiten hasta 50 000 sitemaps hijos. Todas las comprobaciones se ejecutan localmente — no se descargan URLs.

Cómo usar

  1. Pega el contenido de tu sitemap.xml en la caja, o cárgalo desde disco con Load file.
  2. Si no tienes uno a mano, pulsa Paste sample para cargar un ejemplo pequeño.
  3. Mira el badge de estado: los errores impiden que los motores parseen el sitemap; los warnings son válidos pero sospechosos.
  4. Revisa los histogramas de changefreq / priority / host para detectar patrones (p. ej. todas las prioridades a 1.0 — sin sentido; host mezclado — suele ser un error).

Preguntas frecuentes

¿La herramienta descarga las URLs del sitemap?
No — todo ocurre en tu navegador, sin llamadas de red. El validador solo parsea el XML que tú das y lo comprueba contra el spec Sitemaps 0.9. Para verificar la disponibilidad real de las URLs, usa un crawler aparte o `curl -I`.
¿Por qué Google dice que no pongas todas las priority a 1.0?
Porque `priority` es relativa dentro de tu propio sitemap, no absoluta. Si todas las URLs son 1.0 es como si ninguna tuviera prioridad — el campo no aporta información. La documentación de Google dice explícitamente que ignora los sitemaps en los que todas las priority son iguales. Usa un rango con sentido (homepage 1.0, categorías 0.8, artículos 0.6, archivo 0.3 — o sencillamente omite priority).
¿Qué es un sitemap index y cuándo lo necesito?
Un `<sitemapindex>` es un sitemap de sitemaps. Lo necesitas cuando un único sitemap superaría las 50 000 URLs o los 50 MB sin comprimir. El índice lista los sitemaps hijos por URL; cada hijo es un `<urlset>` normal. Google soporta hasta 50 000 hijos por índice, y se pueden anidar.
¿Qué formatos de lastmod se aceptan?
Según el spec, W3C Datetime — bien una fecha (`2026-06-04`), bien un timestamp ISO 8601 completo con offset (`2026-06-04T12:00:00+00:00`). Cualquier otra cosa se marca como warning. `Date.parse` es permisivo y la mayoría de formatos comunes pasan, pero ciñéndote al spec estarás seguro en todos los motores.

Herramientas relacionadas