Validador e inspetor de sitemap.xml
Rede
Valida um sitemap `<urlset>` ou um `<sitemapindex>` em relação ao protocolo Sitemaps 0.9 usado por Google, Bing e todos os principais buscadores. Detecta automaticamente o elemento raiz e checa: contagem de URLs/sitemaps contra o limite de 50 000 por arquivo; tamanho descomprimido contra o limite de 50 MB; URLs absolutas http/https; `<loc>` ≤ 2048 caracteres; `changefreq` ∈ {always, hourly, daily, weekly, monthly, yearly, never}; `priority` em [0.0, 1.0]; `lastmod` como W3C / ISO 8601 válido e não futuro; e avisa sobre `<loc>` duplicados. Para `<urlset>` também detalha a distribuição de changefreq, buckets de priority e hostnames para detectar erros (ex.: tudo em priority 1.0 — Google explicitamente desaconselha, ou sitemap misturando dois hosts).
Nada ainda — cole, solte ou carregue um sitemap.xml para começar.
Valida contra Sitemaps 0.9 (sitemaps.org). Limites: 50 000 URLs por sitemap, 50 MB descomprimido, 2048 caracteres por <loc>. Índices suportam até 50 000 sitemaps filhos. Todas as checagens rodam localmente — nenhuma URL é buscada.
Como usar
- Cole o conteúdo do seu sitemap.xml na caixa, ou carregue do disco via Load file.
- Sem um sitemap à mão, clique em Paste sample para carregar um exemplo pequeno.
- Veja o badge de status: erros impedem os buscadores de parsear o sitemap; warnings são casos válidos mas suspeitos.
- Veja os histogramas de changefreq / priority / host para detectar padrões (ex.: todas as priorities em 1.0 — sem sentido; host misturado — geralmente erro).
Perguntas frequentes
- A ferramenta busca as URLs do sitemap?
- Não — tudo acontece no seu navegador, sem chamadas de rede. O validador apenas parseia o XML fornecido e checa contra a spec Sitemaps 0.9. Para verificar a disponibilidade real das URLs, use um crawler à parte ou `curl -I`.
- Por que o Google diz para não colocar todas as priorities em 1.0?
- Porque `priority` é relativa dentro do seu próprio sitemap, não absoluta. Se todas as URLs estão em 1.0 é como se nenhuma tivesse prioridade — o campo não carrega informação. A documentação do Google explicitamente diz que ignora sitemaps em que todas as priorities são iguais. Use uma faixa com significado (homepage 1.0, categorias 0.8, artigos 0.6, arquivo 0.3 — ou simplesmente omita priority).
- O que é um sitemap index e quando preciso dele?
- Um `<sitemapindex>` é um sitemap de sitemaps. Você precisa quando um único sitemap excederia 50 000 URLs ou 50 MB descomprimido. O índice lista os sitemaps filhos por URL; cada filho é um `<urlset>` comum. Google suporta até 50 000 filhos por índice, e índices podem ser aninhados.
- Quais formatos de lastmod são aceitos?
- Pela spec, W3C Datetime — uma data (`2026-06-04`) ou um timestamp ISO 8601 completo com offset (`2026-06-04T12:00:00+00:00`). Qualquer outra coisa vira warning. `Date.parse` é permissivo e a maioria dos formatos comuns passa, mas siga a spec para ficar seguro em todos os buscadores.
Ferramentas relacionadas
Inspetor de Endereço IP
Digite um endereço IPv4 ou IPv6 e veja sua classe, scope (privado / público / loopback / link-local), valor decimal, binário, notação reverse-DNS e CIDR /32.
Referência de Portas
Cheat sheet pesquisável de ~60 portas TCP / UDP padrão — de 22 (SSH) e 80 (HTTP) até 6379 (Redis) e 27017 (MongoDB).
Referência de Registros DNS
Cheat sheet pesquisável de tipos de registro DNS — A, AAAA, CNAME, MX, TXT, NS, SOA, PTR, SRV, CAA, DNSSEC, SVCB / HTTPS — com exemplos.
Calculadora de Subrede (IPv4 / CIDR)
Parseia CIDR IPv4 em endereço de rede, broadcast, netmask, wildcard, faixa de hosts e classe. Mostra desdobramento binário e status privado/público.
Parser de User Agent
Parseia string User-Agent em navegador, engine, OS, dispositivo e CPU. Detecta 20+ bots incluindo GPTBot, ClaudeBot, PerplexityBot.
Referência de Códigos de Status HTTP
Lista pesquisável de todos os códigos HTTP (1xx-5xx) com resumo, RFC, quando usar e armadilhas comuns.