Экстрактор URL-адресов карты сайта
Вставьте файл sitemap.xml (или просто домен) и получите каждый URL-адрес в виде чистого экспортируемого списка.
Этот экстрактор URL-адресов карты сайта извлекает каждый URL-адрес из любой карты сайта XML за считанные секунды. Он рекурсивно обрабатывает индексные файлы карты сайта, распаковывает карты сайта .xml.gz, фиксирует даты последних модификаций и даже автоматически обнаруживает карту сайта из robots.txt, когда вы знаете только домен. Экспортируйте полный список в формате CSV или TXT — идеальное средство для массовой проверки статуса URL-адресов.
Часто задаваемые вопросы
Что делает экстрактор URL-адресов карты сайта?
Он загружает любую карту сайта XML, анализирует ее и предоставляет вам каждый URL-адрес в виде чистого списка. Если вы наведете его на индекс карты сайта, он также автоматически откроет каждую подкарту сайта — так что вы получите полный список URL-адресов сайта одним щелчком мыши, который можно экспортировать в формате CSV или в виде обычного текста.
Могу ли я просто ввести домен вместо адреса карты сайта?
Да. Введите пустой домен, например example.com, и инструмент проверит robots.txt на наличие объявленных карт сайта, а затем автоматически вернется к общим местам, таким как /sitemap.xml и /sitemap_index.xml.
Поддерживает ли он файлы индекса карты сайта и сжатые карты сайта?
Да. Индексные файлы карты сайта отслеживаются рекурсивно (до 50 дополнительных карт сайта, 3 уровня глубины), а карты сайта .xml.gz, сжатые с помощью gzip, распаковываются автоматически.
Сколько URL-адресов он может извлечь?
До 20 000 URL-адресов за один запуск. На странице показаны первые 1000 значений скорости; Копировать все и экспорт в CSV всегда включают полный список.
Что я могу делать с извлеченными URL-адресами?
Общие рабочие процессы: подайте их в средство массовой проверки статуса URL-адресов, чтобы найти неработающие страницы, проверить покрытие индексации с помощью Google Search Console, создать карты перенаправления для миграций или проанализировать структуру URL-адресов и актуальность последних модов в электронной таблице.