مستخرج URL لخريطة الموقع

الصق ملف sitemap.xml (أو نطاقًا فقط) واحصل على كل عنوان URL كقائمة نظيفة وقابلة للتصدير.

يقوم مستخرج عناوين URL لخريطة الموقع هذا بسحب كل عنوان URL من أي خريطة موقع XML في ثوانٍ. فهو يتعامل مع ملفات فهرس خريطة الموقع بشكل متكرر، ويفك ضغط خرائط مواقع .xml.gz، ويلتقط تواريخ lastmod، بل ويكتشف تلقائيًا خريطة الموقع من ملف robots.txt عندما تعرف المجال فقط. قم بتصدير القائمة الكاملة بتنسيق CSV أو TXT — الوقود المثالي لمدقق حالة URL المجمع.

الأسئلة المتداولة

ماذا يفعل مستخرج URL لخريطة الموقع؟

يقوم بتنزيل أي خريطة موقع XML، ويوزعها، ويمنحك كل عنوان URL بداخله كقائمة نظيفة. إذا قمت بتوجيهه إلى فهرس خريطة الموقع، فإنه يفتح تلقائيًا كل خريطة موقع فرعية أيضًا - بحيث تحصل على مخزون URL الكامل لموقع ما بنقرة واحدة، ويمكن تصديره كملف CSV أو نص عادي.

هل يمكنني فقط إدخال المجال بدلاً من عنوان خريطة الموقع؟

نعم. أدخل نطاقًا مجردًا مثل example.com وستقوم الأداة بفحص ملف robots.txt بحثًا عن خرائط الموقع المعلنة، ثم تعود إلى المواقع الشائعة مثل /sitemap.xml و/sitemap_index.xml تلقائيًا.

هل يدعم ملفات فهرس خريطة الموقع وخرائط المواقع المضغوطة؟

نعم. تتم متابعة ملفات فهرس Sitemap بشكل متكرر (ما يصل إلى 50 خريطة موقع فرعية، وعمق 3 مستويات)، ويتم فك ضغط ملفات Sitemap المضغوطة بتنسيق gzip .xml.gz تلقائيًا.

كم عدد عناوين URL التي يمكنه استخراجها؟

ما يصل إلى 20000 عنوان URL لكل عملية تشغيل. تعرض الصفحة أول 1000 للسرعة؛ يتضمن نسخ الكل وتصدير ملف CSV دائمًا القائمة الكاملة.

ماذا يمكنني أن أفعل بعناوين URL المستخرجة؟

مسارات العمل الشائعة: أدخلها في مدقق حالة عنوان URL المجمع للعثور على الصفحات المعطلة، أو تدقيق تغطية الفهرسة مقابل Google Search Console، أو إنشاء خرائط إعادة التوجيه لعمليات الترحيل، أو تحليل بنية عنوان URL وحداثة Lastmod في جدول بيانات.