站点地图 URL 提取器

粘贴 sitemap.xml(或只是一个域)并将每个 URL 作为干净的可导出列表。

此站点地图 URL 提取器可在几秒钟内从任何 XML 站点地图中提取每个 URL。它递归地处理站点地图索引文件,解压缩 .xml.gz 站点地图,捕获 Lastmod 日期,甚至在您只知道域时从 robots.txt 自动发现站点地图。将完整列表导出为 CSV 或 TXT — 批量 URL 状态检查器的完美燃料。

常见问题解答

站点地图 URL 提取器有什么作用?

它会下载任何 XML 站点地图,对其进行解析,并以干净的列表形式为您提供其中的每个 URL。如果您将其指向站点地图索引,它也会自动打开每个子站点地图 - 这样您只需单击一下即可获得站点的完整 URL 库存,并可导出为 CSV 或纯文本。

我可以只输入域名而不是站点地图地址吗?

是的。输入一个裸域(例如 example.com),该工具会检查 robots.txt 中是否有声明的站点地图,然后自动回退到常见位置,例如 /sitemap.xml 和 /sitemap_index.xml。

它支持站点地图索引文件和压缩站点地图吗?

是的。站点地图索引文件以递归方式跟踪(最多 50 个子站点地图,3 级深度),并且 gzip 压缩的 .xml.gz 站点地图会自动解压缩。

它可以提取多少个 URL?

每次运行最多 20,000 个 URL。页面显示前1000条速度;全部复制和 CSV 导出始终包含完整列表。

我可以对提取的网址做些什么?

常见工作流程:将它们输入批量 URL 状态检查器以查找损坏的页面、针对 Google Search Console 审核索引覆盖率、构建用于迁移的重定向映射,或分析电子表格中的 URL 结构和 Lastmod 新鲜度。