seo-sitemap

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

Sitemap Analysis & Generation

站点地图分析与生成

Mode 1: Analyze Existing Sitemap

模式1:分析现有站点地图

Validation Checks

验证检查

  • Valid XML format
  • URL count <50,000 per file (protocol limit)
  • All URLs return HTTP 200
  • <lastmod>
    dates are accurate (not all identical)
  • No deprecated tags:
    <priority>
    and
    <changefreq>
    are ignored by Google
  • Sitemap referenced in robots.txt
  • Compare crawled pages vs sitemap — flag missing pages
  • XML格式有效
  • 每个文件的URL数量不超过50000个(协议限制)
  • 所有URL返回HTTP 200状态码
  • <lastmod>
    日期准确(并非全部相同)
  • 无废弃标签:
    <priority>
    <changefreq>
    已被谷歌忽略
  • 站点地图在robots.txt中被引用
  • 对比已抓取页面与站点地图,标记缺失页面

Quality Signals

质量指标

  • Sitemap index file if >50k URLs
  • Split by content type (pages, posts, images, videos)
  • No non-canonical URLs in sitemap
  • No noindexed URLs in sitemap
  • No redirected URLs in sitemap
  • HTTPS URLs only (no HTTP)
  • 当URL数量超过50000时使用站点地图索引文件
  • 按内容类型拆分(页面、文章、图片、视频)
  • 站点地图中无非规范URL
  • 站点地图中无noindex标记的URL
  • 站点地图中无重定向URL
  • 仅使用HTTPS URL(不使用HTTP)

Common Issues

常见问题

IssueSeverityFix
>50k URLs in single fileCriticalSplit with sitemap index
Non-200 URLsHighRemove or fix broken URLs
Noindexed URLs includedHighRemove from sitemap
Redirected URLs includedMediumUpdate to final URLs
All identical lastmodLowUse actual modification dates
Priority/changefreq usedInfoCan remove (ignored by Google)
问题严重程度修复方案
单个文件中URL数量超过50000严重使用站点地图索引拆分文件
非200状态码的URL删除或修复失效URL
包含noindex标记的URL从站点地图中移除
包含重定向URL更新为最终目标URL
所有
<lastmod>
日期完全相同
使用实际修改日期
使用了
<priority>
<changefreq>
标签
提示可移除(谷歌已忽略)

Mode 2: Generate New Sitemap

模式2:生成新站点地图

Process

流程

  1. Ask for business type (or auto-detect from existing site)
  2. Load industry template from
    assets/
    directory
  3. Interactive structure planning with user
  4. Apply quality gates:
    • ⚠️ WARNING at 30+ location pages (require 60%+ unique content)
    • 🛑 HARD STOP at 50+ location pages (require justification)
  5. Generate valid XML output
  6. Split at 50k URLs with sitemap index
  7. Generate STRUCTURE.md documentation
  1. 询问业务类型(或从现有网站自动检测)
  2. assets/
    目录加载行业模板
  3. 与用户协作规划站点结构
  4. 应用质量管控规则:
    • 当位置页面数量达到30+时发出⚠️警告(要求60%以上的独特内容)
    • 当位置页面数量达到50+时触发🛑强制停止(需提供合理性说明)
  5. 生成有效的XML输出
  6. 当URL数量超过50000时,使用站点地图索引拆分文件
  7. 生成
    STRUCTURE.md
    架构文档

Safe Programmatic Pages (OK at scale)

可批量生成的安全程序化页面

✅ Integration pages (with real setup docs) ✅ Template/tool pages (with downloadable content) ✅ Glossary pages (200+ word definitions) ✅ Product pages (unique specs, reviews) ✅ User profile pages (user-generated content)
✅ 集成页面(含真实配置文档) ✅ 模板/工具页面(含可下载内容) ✅ 术语表页面(每个定义不少于200词) ✅ 产品页面(含独特规格、用户评价) ✅ 用户资料页面(含用户生成内容)

Penalty Risk (avoid at scale)

违规风险(避免批量生成)

❌ Location pages with only city name swapped ❌ "Best [tool] for [industry]" without industry-specific value ❌ "[Competitor] alternative" without real comparison data ❌ AI-generated pages without human review and unique value
❌ 仅替换城市名称的位置页面 ❌ 无行业专属价值的“最佳[工具]适用于[行业]”类页面 ❌ 无真实对比数据的“[竞品]替代方案”类页面 ❌ 未经人工审核、无独特价值的AI生成页面

Sitemap Format

站点地图格式

Standard Sitemap

标准站点地图

xml
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <lastmod>2026-02-07</lastmod>
  </url>
</urlset>
xml
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <lastmod>2026-02-07</lastmod>
  </url>
</urlset>

Sitemap Index (for >50k URLs)

站点地图索引(适用于URL数量>50000的情况)

xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-pages.xml</loc>
    <lastmod>2026-02-07</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-posts.xml</loc>
    <lastmod>2026-02-07</lastmod>
  </sitemap>
</sitemapindex>
xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-pages.xml</loc>
    <lastmod>2026-02-07</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-posts.xml</loc>
    <lastmod>2026-02-07</lastmod>
  </sitemap>
</sitemapindex>

Output

输出结果

For Analysis

分析任务输出

  • VALIDATION-REPORT.md
    — analysis results
  • Issues list with severity
  • Recommendations
  • VALIDATION-REPORT.md
    — 分析结果
  • 带严重程度标记的问题列表
  • 改进建议

For Generation

生成任务输出

  • sitemap.xml
    (or split files with index)
  • STRUCTURE.md
    — site architecture documentation
  • URL count and organization summary
  • sitemap.xml
    (或带索引的拆分文件)
  • STRUCTURE.md
    — 站点架构文档
  • URL数量与组织架构摘要