Question 1

Что извлекает этот парсер веб-страниц?

Accepted Answer

Он возвращает заголовок страницы, метаописание, канонический URL-адрес, теги Open Graph (включая предварительный просмотр изображения), структуру заголовка, все ссылки, сгруппированные как внутренние и внешние, каждое изображение с его замещающим текстом и полный основной текст с количеством слов.

Question 2

Является ли веб-скребок бесплатным и нужна ли ему учетная запись?

Accepted Answer

Да, это совершенно бесплатно и без регистрации. Вы можете парсить страницы и копировать или скачивать извлеченный текст без регистрации.

Question 3

Как он получает страницу?

Accepted Answer

Когда вы нажимаете «Очистить», URL-адрес отправляется на наш сервер (api.forewrite.com), который получает HTML-код страницы от вашего имени и анализирует его. Это позволяет избежать ограничений CORS браузера и работает на страницах, которые ваш браузер не может получить напрямую.

Question 4

Вы сохраняете страницу или мой URL?

Accepted Answer

Нет. Страница загружается, анализируется, и результат возвращается в ваш браузер. Мы не сохраняем скопированный контент и не записываем URL-адрес.

Question 5

Может ли он парсить любой сайт?

Accepted Answer

Он работает на большинстве общедоступных страниц, которые возвращают стандартный HTML. Страницы, защищенные входами в систему, платным доступом, агрессивной защитой от ботов или полностью отображаемые с помощью клиентского JavaScript, могут возвращать мало контента или вообще не возвращать его.

Question 6

В чем разница между внутренними и внешними ссылками?

Accepted Answer

Внутренние ссылки указывают на тот же домен, что и страница, которую вы скопировали; внешние ссылки указывают на другие домены. Инструмент считает каждый отдельно, поэтому вы можете сразу проверить ссылочный профиль страницы.

Question 7

Могу ли я экспортировать извлеченный текст?

Accepted Answer

Да. Используйте кнопку «Копировать текст», чтобы скопировать его в буфер обмена, или «Загрузить .txt», чтобы сохранить весь извлеченный текст в виде обычного текстового файла, названного в честь домена страницы.

Question 8

Законен ли парсинг веб-страниц?

Accepted Answer

Чтение HTML-кода общедоступной страницы, как правило, подходит для анализа, но всегда соблюдайте условия обслуживания каждого сайта, правила роботов и авторские права. Используйте извлеченные данные ответственно.

Парсер веб-страниц

SEO

Headings

Links

Images

Часто задаваемые вопросы

SEO

Headings

Links

Images

Часто задаваемые вопросы

Сопутствующие инструменты

URL-кодировщик

OCR PDF

Массовая проверка статуса URL-адресов

Открытие нескольких URL-адресов

Проверка скорости веб-сайта

Текст в JSON