Парсер веб-страниц

Вставьте URL-адрес и извлеките его данные SEO, заголовки, ссылки, изображения и текст одним щелчком мыши.

Our server fetches the page on your behalf — the URL is sent to api.forewrite.com to retrieve the HTML, and the result is not stored.

Этот парсер веб-страниц получает любой общедоступный URL-адрес на нашем сервере и извлекает для вас структурированный контент: SEO-заголовок, мета-описание, канонические теги и теги Open Graph, полную схему заголовка (h1/h2/h3), каждую ссылку, разделенную на внутреннюю и внешнюю, все изображения с их замещающим текстом и читаемый основной текст с количеством слов. Используйте его для аудита страницы, планирования контента или копирования чистого текста — без расширения, без учетной записи и ничего не сохраняется. Введите URL-адрес, нажмите «Очистить», затем скопируйте или загрузите извлеченный текст.

Часто задаваемые вопросы

Что извлекает этот парсер веб-страниц?

Он возвращает заголовок страницы, метаописание, канонический URL-адрес, теги Open Graph (включая предварительный просмотр изображения), структуру заголовка, все ссылки, сгруппированные как внутренние и внешние, каждое изображение с его замещающим текстом и полный основной текст с количеством слов.

Является ли веб-скребок бесплатным и нужна ли ему учетная запись?

Да, это совершенно бесплатно и без регистрации. Вы можете парсить страницы и копировать или скачивать извлеченный текст без регистрации.

Как он получает страницу?

Когда вы нажимаете «Очистить», URL-адрес отправляется на наш сервер (api.forewrite.com), который получает HTML-код страницы от вашего имени и анализирует его. Это позволяет избежать ограничений CORS браузера и работает на страницах, которые ваш браузер не может получить напрямую.

Вы сохраняете страницу или мой URL?

Нет. Страница загружается, анализируется, и результат возвращается в ваш браузер. Мы не сохраняем скопированный контент и не записываем URL-адрес.

Может ли он парсить любой сайт?

Он работает на большинстве общедоступных страниц, которые возвращают стандартный HTML. Страницы, защищенные входами в систему, платным доступом, агрессивной защитой от ботов или полностью отображаемые с помощью клиентского JavaScript, могут возвращать мало контента или вообще не возвращать его.

В чем разница между внутренними и внешними ссылками?

Внутренние ссылки указывают на тот же домен, что и страница, которую вы скопировали; внешние ссылки указывают на другие домены. Инструмент считает каждый отдельно, поэтому вы можете сразу проверить ссылочный профиль страницы.

Могу ли я экспортировать извлеченный текст?

Да. Используйте кнопку «Копировать текст», чтобы скопировать его в буфер обмена, или «Загрузить .txt», чтобы сохранить весь извлеченный текст в виде обычного текстового файла, названного в честь домена страницы.

Законен ли парсинг веб-страниц?

Чтение HTML-кода общедоступной страницы, как правило, подходит для анализа, но всегда соблюдайте условия обслуживания каждого сайта, правила роботов и авторские права. Используйте извлеченные данные ответственно.