العودة إلى لوحة التحكم

التوثيق

تعلّم كيفية استخدام Asyntai

زحف الموقع

استخراج المحتوى تلقائياً من صفحات موقعك الإلكتروني

بدء الزحف

نظرة عامة

يكتشف زاحف الموقع تلقائياً المحتوى ويستخرجه من صفحات متعددة على موقعك الإلكتروني. بدلاً من إضافة الصفحات واحدة تلو الأخرى، يمكنك زحف موقعك بالكامل (أو أقسام محددة) وإضافة جميع المحتوى إلى قاعدة معرفة الذكاء الاصطناعي تلقائياً.

يتبع الزاحف الروابط لاكتشاف الصفحات، ويستخرج المحتوى النصي، ويعالج كل شيء حتى يتمكن الذكاء الاصطناعي من الإجابة على أسئلة حول موقعك الإلكتروني.

أوضاع الزحف

يمكنك الاختيار بين وضعين للزحف حسب احتياجاتك:

الوضع التلقائي

يبدأ الزاحف من صفحتك الرئيسية ويكتشف الصفحات تلقائياً باتباع الروابط. كما يتحقق من ملف sitemap.xml إن وُجد. الأفضل لزحف موقعك بالكامل أو أقسام كبيرة منه.

جميع الخطط

الوضع اليدوي

تحدد عناوين URL الدقيقة للزحف (مفصولة بفواصل). يزور الزاحف تلك الصفحات المحددة فقط. الأفضل عندما تريد إضافة صفحات معينة فقط إلى قاعدة المعرفة.

حدود الزحف حسب الخطة

يعتمد الحد الأقصى لعدد الصفحات التي يمكنك زحفها على خطتك:

الخطة الحد الأقصى للصفحات الوضع اليدوي محمية بكلمة مرور
Free 50 صفحة
Starter 250 صفحة
Standard 1,000 صفحة
Pro 5,000 صفحة

صفحات محمية بكلمة مرور

هل تحتاج إلى زحف صفحات خلف تسجيل دخول؟ فعّل خيار "صفحات محمية بكلمة مرور" لزحف المحتوى المخصص للأعضاء أو لوحات التحكم أو أي مناطق محمية بكلمة مرور في موقعك.

كيفية الاستخدام

  1. فعّل زر "صفحات محمية بكلمة مرور" في صفحة الزحف
  2. أدخل رابط صفحة تسجيل الدخول (مثلاً، yoursite.com/login)
  3. أدخل اسم المستخدم/البريد الإلكتروني وكلمة المرور
  4. انقر على بدء الزحف - سيقوم النظام بتسجيل الدخول أولاً، ثم زحف الصفحات المحمية

كيف يعمل

عند تفعيل حماية كلمة المرور، يقوم الزاحف بـ:

  1. زيارة صفحة تسجيل الدخول واكتشاف حقول النموذج تلقائياً
  2. إرسال بيانات الاعتماد (بما في ذلك أي رموز CSRF)
  3. الحفاظ على الجلسة المُصادق عليها أثناء الزحف
  4. البدء من حيث يتم توجيهك بعد تسجيل الدخول (مثلاً، لوحة التحكم)
  5. اكتشاف وزحف جميع الصفحات المحمية التي يمكن العثور عليها

نصيحة: يكتشف الزاحف تلقائياً حقول النموذج (البريد الإلكتروني، اسم المستخدم، كلمة المرور) ورموز الأمان، لذا فهو يعمل مع معظم نماذج تسجيل الدخول دون تكوين إضافي.

متقدم: أسماء الحقول المخصصة

إذا كان نموذج تسجيل الدخول يستخدم أسماء حقول غير قياسية، وسّع قسم "متقدم" وحدد:

  • اسم حقل المستخدم - اسم حقل النموذج لاسم المستخدم/البريد الإلكتروني (مثلاً، user_email)
  • اسم حقل كلمة المرور - اسم حقل النموذج لكلمة المرور (مثلاً، user_pass)

القيود: يعمل الزحف المحمي بكلمة مرور مع نماذج تسجيل الدخول HTML القياسية. قد لا يعمل مع:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • تسجيلات الدخول المحمية بـ CAPTCHA أو reCAPTCHA
  • المصادقة الثنائية (2FA)
  • تسجيلات الدخول عبر OAuth (Google وFacebook وغيرها)
  • تدفقات تسجيل الدخول متعددة الخطوات

نصيحة: بدلاً من استخدام حسابك الشخصي، فكر في إنشاء حساب مخصص للزحف. هذا يتيح لك التحكم بدقة فيما يمكن للزاحف الوصول إليه.

أفضل الممارسات

قبل الزحف

  • تأكد من أن موقعك الإلكتروني متاح وأن الصفحات تُحمّل بشكل صحيح
  • تحقق من أن الصفحات المهمة مرتبطة من صفحتك الرئيسية أو خريطة الموقع
  • للزحف المحمي بكلمة مرور، تحقق من أن بيانات الاعتماد تعمل

اختيار الصفحات

  • ابدأ بأهم صفحاتك - صفحات المنتجات والأسئلة الشائعة والخدمات
  • استخدم الوضع اليدوي إذا كنت تحتاج صفحات محددة فقط
  • تجنب زحف الصفحات التي تحتوي على معلومات قديمة أو غير دقيقة

بعد الزحف

  • راجع المحتوى المُزاحَف في قاعدة المعرفة
  • أزل أي صفحات غير ذات صلة تم التقاطها
  • اختبر الذكاء الاصطناعي بأسئلة حول المحتوى المُزاحَف
  • أعد الزحف دورياً للحفاظ على تحديث المحتوى

ملاحظة: يحل كل زحف جديد محل الزحف السابق لذلك الموقع. سيستخدم الذكاء الاصطناعي دائماً أحدث محتوى تم زحفه.

إدارة الصفحات المُزاحَفة

بعد اكتمال الزحف، يمكنك معاينة وإدارة الصفحات الفردية من قسم قاعدة المعرفة في لوحة التحكم.

معاينة محتوى الصفحة

  1. انتقل إلى لوحة التحكم وافتح قسم قاعدة المعرفة
  2. انقر على عنصر الزحف لفتحه — سترى قائمة بجميع الصفحات المُزاحَفة
  3. انقر على عنوان أي صفحة لمعاينة محتواها المُستخرَج
  4. استخدم زر العودة إلى الصفحات للعودة إلى قائمة الصفحات

نصيحة: معاينة الصفحات طريقة رائعة للتحقق من أن الزاحف استخرج المحتوى الصحيح. إذا بدت الصفحة خاطئة، يمكنك تعديلها مباشرة أو حذفها وإضافة المحتوى يدوياً بدلاً من ذلك.

تعديل الصفحات الفردية

يمكنك تعديل المحتوى المُستخرَج لأي صفحة مُزاحَفة. هذا مفيد لإصلاح مشاكل التنسيق أو إزالة الأقسام غير ذات الصلة أو إضافة المعلومات المفقودة.

  1. افتح عنصر الزحف وانقر على عنوان الصفحة لعرض محتواها
  2. انقر على زر تعديل في أعلى المعاينة
  3. عدّل العنوان أو المحتوى حسب الحاجة
  4. انقر على حفظ وإعادة التضمين — سيتم إعادة إنشاء تضمينات الذكاء الاصطناعي للصفحة بالمحتوى المحدّث

ملاحظة: تعديل الصفحة يعيد تضمين تلك الصفحة المحددة فقط، وليس الزحف بالكامل. صفحاتك المُزاحَفة الأخرى لا تتأثر.

إعادة الزحف إلى صفحات فردية

إذا تم تحديث صفحة على موقعك الإلكتروني، يمكنك إعادة الزحف إلى تلك الصفحة فقط دون إعادة الزحف إلى موقعك بالكامل.

  1. افتح عنصر الزحف من قاعدة المعرفة
  2. Click the re-crawl button next to the page you want to update
  3. تأكيد — سيتم إعادة جلب الصفحة وتحديث تضميناتها بأحدث محتوى

نصيحة: هذا رائع للحفاظ على تحديث الصفحات الفردية بعد تغييرات المحتوى، دون الحاجة إلى إعادة الزحف إلى مئات الصفحات.

حذف الصفحات الفردية

يمكنك إزالة صفحات محددة من الزحف دون حذف الزحف بالكامل. هذا مفيد لإزالة الصفحات غير ذات الصلة أو المكررة أو المُزاحَفة بشكل خاطئ.

  1. افتح عنصر الزحف من قاعدة المعرفة
  2. انقر على زر حذف بجانب الصفحة التي تريد إزالتها
  3. أكد الحذف — ستتم إزالة الصفحة وتضميناتها نهائياً

ملاحظة: إذا حذفت جميع الصفحات من الزحف، سيتم إزالة إدخال الزحف بالكامل تلقائياً من قاعدة المعرفة.

استكشاف الأخطاء وإصلاحها

الزحف يُرجع صفحات أقل من المتوقع

  • قد لا تكون الصفحات مرتبطة من صفحات قابلة للاكتشاف
  • قد تكون بعض الصفحات محظورة بواسطة robots.txt
  • قد تحظر Cloudflare أو خدمات الأمان الأخرى الزاحف
  • الحل: استخدم الوضع اليدوي لتحديد عناوين URL الدقيقة

فشل الزحف المحمي بكلمة مرور

  • تحقق من صحة بيانات الاعتماد
  • تحقق مما إذا كان تسجيل الدخول يستخدم CAPTCHA أو 2FA
  • جرب تحديد أسماء حقول مخصصة في الإعدادات المتقدمة
  • قد يستخدم موقعك مصادقة مبنية على JavaScript (غير مدعومة)

بدائل إذا لم يعمل الزحف:

  • اجعل الصفحات عامة مؤقتاً، ثم ازحفها، ثم أعد تفعيل الحماية
  • احفظ الصفحات كملفات HTML وارفعها عبر الرفع المجمّع

يبدو المحتوى غير مكتمل

  • قد يتم تحميل بعض المحتوى عبر JavaScript (لا يتم استخراجه)
  • قد يكون المحتوى في صور (لا يتم استخراجه كنص)
  • الحل: أضف المحتوى المفقود يدوياً عبر رفع النص أو PDF