サイトマップ URL エクストラクター
sitemap.xml (またはドメインのみ) を貼り付けて、すべての URL をクリーンなエクスポート可能なリストとして取得します。
このサイトマップ URL エクストラクターは、XML サイトマップからすべての URL を数秒で抽出します。サイトマップ インデックス ファイルを再帰的に処理し、.xml.gz サイトマップを解凍し、lastmod の日付をキャプチャし、ドメインしかわかっていない場合には robots.txt からサイトマップを自動検出します。完全なリストを CSV または TXT としてエクスポートします。これは、一括 URL ステータス チェッカーに最適な燃料です。
よくある質問
サイトマップ URL エクストラクターは何をしますか?
XML サイトマップをダウンロードして解析し、内部のすべての URL をクリーンなリストとして提供します。サイトマップ インデックスを指定すると、各サブサイトマップも自動的に開きます。そのため、ワンクリックでサイトの完全な URL インベントリを取得でき、CSV またはプレーン テキストとしてエクスポートできます。
サイトマップ アドレスの代わりにドメインを入力することはできますか?
はい。 example.com のようなベア ドメインを入力すると、ツールは robots.txt で宣言されたサイトマップをチェックし、/sitemap.xml や /sitemap_index.xml などの一般的な場所に自動的にフォールバックします。
サイトマップ インデックス ファイルと圧縮サイトマップはサポートされていますか?
はい。サイトマップ インデックス ファイルは再帰的に追跡され (最大 50 のサブサイトマップ、3 レベルの深さ)、gzip 圧縮された .xml.gz サイトマップは自動的に解凍されます。
いくつの URL を抽出できますか?
実行ごとに最大 20,000 の URL。このページには、速度に関する最初の 1,000 件が表示されます。すべてコピーおよび CSV エクスポートには、常に完全なリストが含まれます。
抽出した URL で何ができるでしょうか?
一般的なワークフロー: これらを一括 URL ステータス チェッカーにフィードして、壊れたページを見つけたり、Google Search Console に対するインデックス作成カバレッジを監査したり、移行用のリダイレクト マップを作成したり、スプレッドシートで URL 構造と lastmod の鮮度を分析したりします。