Ekstraktor URL Peta Situs

Tempel peta situs.xml (atau hanya domain) dan dapatkan setiap URL sebagai daftar yang bersih dan dapat diekspor.

Ekstraktor URL Peta Situs ini menarik setiap URL dari peta situs XML mana pun dalam hitungan detik. Ia menangani file indeks peta situs secara rekursif, mendekompresi peta situs .xml.gz, mencatat tanggal mod terakhir, dan bahkan menemukan peta situs secara otomatis dari robots.txt ketika Anda hanya mengetahui domainnya. Ekspor daftar lengkap sebagai CSV atau TXT — bahan bakar sempurna untuk Pemeriksa Status URL Massal.

Pertanyaan yang Sering Diajukan

Apa yang dilakukan ekstraktor URL peta situs?

Itu mengunduh peta situs XML apa pun, mem-parsingnya, dan memberi Anda setiap URL di dalamnya sebagai daftar bersih. Jika Anda mengarahkannya ke indeks peta situs, setiap sub-peta situs juga akan terbuka secara otomatis — sehingga Anda mendapatkan inventaris URL lengkap sebuah situs dalam satu klik, dapat diekspor sebagai CSV atau teks biasa.

Bisakah saya memasukkan domain saja, bukan alamat peta situs?

Ya. Masukkan domain kosong seperti example.com dan alat ini akan memeriksa robots.txt untuk peta situs yang dideklarasikan, lalu kembali ke lokasi umum seperti /sitemap.xml dan /sitemap_index.xml secara otomatis.

Apakah ini mendukung file indeks peta situs dan peta situs terkompresi?

Ya. File indeks peta situs diikuti secara rekursif (hingga 50 sub-peta situs, kedalaman 3 tingkat), dan peta situs .xml.gz yang dikompresi gzip didekompresi secara otomatis.

Berapa banyak URL yang dapat diekstraksi?

Hingga 20.000 URL per proses. Halaman tersebut menunjukkan 1.000 pertama untuk kecepatan; ekspor Salin Semua dan CSV selalu menyertakan daftar lengkap.

Apa yang dapat saya lakukan dengan URL yang diekstraksi?

Alur kerja umum: memasukkannya ke dalam Pemeriksa Status URL Massal untuk menemukan halaman yang rusak, mengaudit cakupan pengindeksan terhadap Google Search Console, membuat peta pengalihan untuk migrasi, atau menganalisis struktur URL dan kesegaran mod terakhir dalam spreadsheet.