AZ Tools

Sitemap.xml 验证与查看器

网络

按 Google、Bing 等主流搜索引擎使用的 Sitemaps 0.9 协议,验证 `<urlset>` 或 `<sitemapindex>` 文件。自动识别根元素,然后检查:每文件 50 000 URL/sitemap 限制;未压缩 50 MB 限制;http/https 绝对 URL;`<loc>` 长度 ≤ 2048;`changefreq` ∈ {always, hourly, daily, weekly, monthly, yearly, never};`priority` ∈ [0.0, 1.0];`lastmod` 是有效 W3C / ISO 8601 且不晚于今日;并对重复 `<loc>` 给出警告。对 `<urlset>` 还展示 changefreq / priority 区间 / 主机名分布,便于发现错误(如全部 URL priority=1.0 —— Google 明确不建议;或一份 sitemap 混用两个主机 —— 通常是失误)。

尚无输入 —— 粘贴、拖入或加载 sitemap.xml 即可开始。

对 Sitemaps 0.9(sitemaps.org)进行验证。限制:每个 sitemap 50 000 个 URL、未压缩 50 MB、<loc> 2048 字符。索引最多 50 000 个子 sitemap。所有检查在本地完成 —— 不会获取任何 URL。

使用方法

  1. 把 sitemap.xml 内容粘贴到输入框,或用「Load file」从磁盘加载。
  2. 没有现成 sitemap?点「Paste sample」加载一个小示例。
  3. 看状态徽标:错误会让搜索引擎无法解析;警告是有效但可疑的情况。
  4. 查看下方 changefreq / priority / host 直方图发现模式(如全部 priority=1.0 → 无意义;混用主机 → 通常错误)。

常见问题

工具会真的去抓取 sitemap 里的 URL 吗?
不会 —— 全部在浏览器中完成,无网络请求。验证器只解析你提供的 XML,并按 Sitemaps 0.9 规范进行检查。若要验证 URL 自身可达性,请用单独的爬虫或 `curl -I`。
为什么 Google 不建议所有 priority 都设 1.0?
因为 `priority` 是你自己 sitemap 内部的相对值,不是绝对值。如果所有 URL 都是 1.0,就等同于没有 priority —— 字段不传递任何信息。Google 文档明确表示会忽略所有 priority 相同的 sitemap。请使用有意义的范围(首页 1.0、栏目 0.8、文章 0.6、归档 0.3 —— 或干脆省略 priority)。
sitemap index 是什么?何时需要?
`<sitemapindex>` 是「sitemap 的 sitemap」。当单个 sitemap 会超过 50 000 URL 或未压缩 50 MB 时就需要它。索引按 URL 列出子 sitemap,每个子 sitemap 都是普通 `<urlset>`。Google 支持每个索引最多 50 000 个子 sitemap,索引也可嵌套。
lastmod 支持哪些格式?
按规范是 W3C Datetime —— 仅日期(`2026-06-04`)或带偏移的完整 ISO 8601 时间戳(`2026-06-04T12:00:00+00:00`)。其他形式会作为警告。`Date.parse` 较宽容,大多常见格式都能通过,但若想兼容所有搜索引擎,请坚持规范格式。

相关工具