Sitemap.xml 验证与查看器
网络
按 Google、Bing 等主流搜索引擎使用的 Sitemaps 0.9 协议,验证 `<urlset>` 或 `<sitemapindex>` 文件。自动识别根元素,然后检查:每文件 50 000 URL/sitemap 限制;未压缩 50 MB 限制;http/https 绝对 URL;`<loc>` 长度 ≤ 2048;`changefreq` ∈ {always, hourly, daily, weekly, monthly, yearly, never};`priority` ∈ [0.0, 1.0];`lastmod` 是有效 W3C / ISO 8601 且不晚于今日;并对重复 `<loc>` 给出警告。对 `<urlset>` 还展示 changefreq / priority 区间 / 主机名分布,便于发现错误(如全部 URL priority=1.0 —— Google 明确不建议;或一份 sitemap 混用两个主机 —— 通常是失误)。
尚无输入 —— 粘贴、拖入或加载 sitemap.xml 即可开始。
对 Sitemaps 0.9(sitemaps.org)进行验证。限制:每个 sitemap 50 000 个 URL、未压缩 50 MB、<loc> 2048 字符。索引最多 50 000 个子 sitemap。所有检查在本地完成 —— 不会获取任何 URL。
使用方法
- 把 sitemap.xml 内容粘贴到输入框,或用「Load file」从磁盘加载。
- 没有现成 sitemap?点「Paste sample」加载一个小示例。
- 看状态徽标:错误会让搜索引擎无法解析;警告是有效但可疑的情况。
- 查看下方 changefreq / priority / host 直方图发现模式(如全部 priority=1.0 → 无意义;混用主机 → 通常错误)。
常见问题
- 工具会真的去抓取 sitemap 里的 URL 吗?
- 不会 —— 全部在浏览器中完成,无网络请求。验证器只解析你提供的 XML,并按 Sitemaps 0.9 规范进行检查。若要验证 URL 自身可达性,请用单独的爬虫或 `curl -I`。
- 为什么 Google 不建议所有 priority 都设 1.0?
- 因为 `priority` 是你自己 sitemap 内部的相对值,不是绝对值。如果所有 URL 都是 1.0,就等同于没有 priority —— 字段不传递任何信息。Google 文档明确表示会忽略所有 priority 相同的 sitemap。请使用有意义的范围(首页 1.0、栏目 0.8、文章 0.6、归档 0.3 —— 或干脆省略 priority)。
- sitemap index 是什么?何时需要?
- `<sitemapindex>` 是「sitemap 的 sitemap」。当单个 sitemap 会超过 50 000 URL 或未压缩 50 MB 时就需要它。索引按 URL 列出子 sitemap,每个子 sitemap 都是普通 `<urlset>`。Google 支持每个索引最多 50 000 个子 sitemap,索引也可嵌套。
- lastmod 支持哪些格式?
- 按规范是 W3C Datetime —— 仅日期(`2026-06-04`)或带偏移的完整 ISO 8601 时间戳(`2026-06-04T12:00:00+00:00`)。其他形式会作为警告。`Date.parse` 较宽容,大多常见格式都能通过,但若想兼容所有搜索引擎,请坚持规范格式。
相关工具
IP 地址检查器
输入 IPv4 或 IPv6 地址,查看其类、scope(私有 / 公共 / 回环 / 链路本地)、十进制值、二进制、反向 DNS 表示以及 /32 CIDR。
端口号参考
约 60 个标准 TCP / UDP 端口号的可搜索速查表 — 从 22 (SSH)、80 (HTTP) 到 6379 (Redis)、27017 (MongoDB)。
DNS 记录参考
可搜索的 DNS 记录类型速查表 — A、AAAA、CNAME、MX、TXT、NS、SOA、PTR、SRV、CAA、DNSSEC、SVCB / HTTPS — 含示例。
子网计算器(IPv4 / CIDR)
解析 IPv4 CIDR:网络地址、广播、子网掩码、通配符、主机范围、地址类。附二进制细节与公网/私网判定。
User Agent 解析器
把 User-Agent 字符串解析为浏览器、引擎、操作系统、设备、CPU。识别 20+ 种爬虫,含 GPTBot、ClaudeBot、PerplexityBot。
HTTP 状态码参考
可搜索的全部 HTTP 状态码(1xx-5xx)参考 — 含概要、RFC、使用时机与常见陷阱。