Sitemap.xml 검증기 & 인스펙터
네트워크
Google·Bing 등 모든 주요 검색엔진이 사용하는 Sitemaps 0.9 프로토콜에 대해 `<urlset>` 사이트맵 또는 `<sitemapindex>`를 검증합니다. 루트 엘리먼트를 자동 감지한 뒤: 파일당 50 000개 URL/사이트맵 제한, 비압축 50 MB 제한, http/https 절대 URL, `<loc>` 길이 ≤ 2048자, `changefreq`가 always / hourly / daily / weekly / monthly / yearly / never 중 하나인지, `priority`가 [0.0, 1.0] 범위인지, `lastmod`가 W3C / ISO 8601 유효 일자이고 미래가 아닌지를 검사하며, 중복 `<loc>`는 경고로 표시합니다. `<urlset>`에 대해서는 changefreq / priority 버킷 / 호스트명 분포도 보여줘 실수(예: 모든 URL priority 1.0 — Google이 명시적으로 권장하지 않음, 또는 한 사이트맵에 두 호스트가 섞이는 실수)를 한눈에 잡을 수 있습니다.
아직 입력 없음 — 시작하려면 sitemap.xml을 붙여넣거나 로드하세요.
Sitemaps 0.9(sitemaps.org) 기준 검증. 한도: 사이트맵당 50 000 URL, 비압축 50 MB, <loc> 2048자. 인덱스는 최대 50 000 자식 사이트맵. 모든 검사는 로컬에서 — URL은 가져오지 않습니다.
사용법
- sitemap.xml 내용을 박스에 붙여넣거나 'Load file' 버튼으로 디스크에서 로드하세요.
- 샘플이 필요하면 'Paste sample'을 클릭해 작은 예시를 로드하세요.
- 상태 배지 확인: 에러는 검색엔진의 사이트맵 파싱을 막고, 경고는 유효하지만 의심스러운 경우입니다.
- 아래의 changefreq / priority / 호스트 히스토그램으로 패턴 점검(예: priority 전부 1.0은 무의미, 한 사이트맵에 호스트 혼합은 보통 실수).
자주 묻는 질문
- 사이트맵 안의 URL을 실제로 가져오나요?
- 아니요 — 모든 동작은 브라우저 내에서, 네트워크 호출 없이 이뤄집니다. 입력하신 XML을 파싱해 Sitemaps 0.9 사양에 대해 검사만 합니다. URL 자체의 도달 가능성 검증은 별도 크롤러나 `curl -I`로 수행하세요.
- 왜 Google은 priority 전부 1.0을 권장하지 않나요?
- `priority`는 절댓값이 아니라 자기 사이트맵 내 상대값이기 때문입니다. 모든 URL이 1.0이면 필드가 정보를 전혀 제공하지 못합니다 — Google 문서도 모든 priority가 같은 사이트맵은 이 필드를 무시한다고 명시. 의미 있는 범위를 쓰세요(홈 1.0, 카테고리 0.8, 기사 0.6, 아카이브 0.3 — 또는 그냥 priority를 빼세요).
- 사이트맵 인덱스는 뭐고 언제 필요한가요?
- `<sitemapindex>`는 사이트맵의 사이트맵입니다. 단일 사이트맵이 50 000 URL 또는 비압축 50 MB를 초과할 때 필요합니다. 인덱스는 자식 사이트맵을 URL로 나열하고, 각 자식은 일반 `<urlset>`입니다. Google은 인덱스당 최대 50 000개 자식 사이트맵을 지원하며 인덱스 중첩도 가능합니다.
- 어떤 lastmod 포맷이 허용되나요?
- 사양상 W3C Datetime — 날짜만(`2026-06-04`) 또는 오프셋 포함 ISO 8601 전체(`2026-06-04T12:00:00+00:00`). 그 외는 경고. `Date.parse`가 관대해 흔한 포맷은 대부분 통과하지만, 모든 검색엔진에서 안전하려면 사양을 지키세요.
관련 도구
IP 주소 분석
IPv4 또는 IPv6 입력 → 클래스·범위(사설·공인·loopback·link-local)·10진수·2진수·reverse DNS·/32 CIDR 표시.
포트 번호 참조
약 60개 표준 TCP / UDP 포트 번호 검색 가능한 치트시트 — 22(SSH)·80(HTTP)·6379(Redis)·27017(MongoDB) 등.
DNS 레코드 참조
DNS 레코드 타입 검색 가능한 치트시트 — A·AAAA·CNAME·MX·TXT·NS·SOA·PTR·SRV·CAA·DNSSEC·SVCB / HTTPS — 예시 포함.
서브넷 계산기 (IPv4 / CIDR)
IPv4 CIDR을 네트워크 주소·브로드캐스트·넷마스크·와일드카드·호스트 범위·클래스로 파싱. 이진 분석과 사설/공인 상태 표시.
User Agent 파서
User-Agent 문자열을 브라우저·엔진·OS·디바이스·CPU로 파싱. GPTBot·ClaudeBot·PerplexityBot 포함 20+ 봇 감지.
HTTP 상태 코드 레퍼런스
1xx-5xx 모든 HTTP 상태 코드 검색 — 요약·RFC·사용 시점·흔한 함정 포함.