Επιστροφή στον Πίνακα Ελέγχου

Τεκμηρίωση

Μάθετε πώς να χρησιμοποιείτε το Asyntai

Ανίχνευση Ιστότοπου

Αυτόματη εξαγωγή περιεχομένου από τις σελίδες του ιστότοπού σας

Ξεκινήστε την Ανίχνευση

Επισκόπηση

Ο ανιχνευτής ιστότοπου ανακαλύπτει και εξάγει αυτόματα περιεχόμενο από πολλές σελίδες του ιστότοπού σας. Αντί να προσθέτετε σελίδες μία προς μία, μπορείτε να ανιχνεύσετε ολόκληρο τον ιστότοπό σας (ή συγκεκριμένα τμήματα) και να προστεθεί αυτόματα όλο το περιεχόμενο στη βάση γνώσεων της ΤΝ σας.

Ο ανιχνευτής ακολουθεί συνδέσμους για να ανακαλύπτει σελίδες, εξάγει περιεχόμενο κειμένου και επεξεργάζεται τα πάντα ώστε η ΤΝ σας να μπορεί να απαντά σε ερωτήσεις για τον ιστότοπό σας.

Λειτουργίες Ανίχνευσης

You can choose between two crawl modes depending on your needs:

Αυτόματη Λειτουργία

Ο ανιχνευτής ξεκινά από την αρχική σελίδα σας και ανακαλύπτει αυτόματα σελίδες ακολουθώντας συνδέσμους. Ελέγχει επίσης το sitemap.xml σας αν είναι διαθέσιμο. Ιδανικό για ανίχνευση ολόκληρου του ιστότοπού σας ή μεγάλων τμημάτων του.

Όλα τα Πλάνα

Χειροκίνητη Λειτουργία

Καθορίζετε ακριβείς διευθύνσεις URL για ανίχνευση (διαχωρισμένες με κόμμα). Ο ανιχνευτής επισκέπτεται μόνο αυτές τις συγκεκριμένες σελίδες. Ιδανικό όταν θέλετε να προσθέσετε μόνο συγκεκριμένες σελίδες στη βάση γνώσεων σας.

Όρια Ανίχνευσης ανά Πλάνο

The maximum number of pages you can crawl depends on your plan:

Πλάνο Μέγιστες Σελίδες Χειροκίνητη Λειτουργία Προστατευμένο με Κωδικό
Δωρεάν 50 σελίδες
Starter 250 σελίδες
Standard 1.000 σελίδες
Pro 5.000 σελίδες

Σελίδες Προστατευμένες με Κωδικό

Χρειάζεστε ανίχνευση σελίδων πίσω από σύνδεση; Ενεργοποιήστε την επιλογή "Σελίδες Προστατευμένες με Κωδικό" για ανίχνευση περιεχομένου μόνο για μέλη, πινάκων ελέγχου ή οποιωνδήποτε περιοχών του ιστότοπού σας που προστατεύονται με κωδικό.

Πώς να Χρησιμοποιήσετε

  1. Ενεργοποιήστε τον διακόπτη "Σελίδες Προστατευμένες με Κωδικό" στη σελίδα ανίχνευσης
  2. Εισαγάγετε τη Διεύθυνση URL Σελίδας Σύνδεσης (π.χ., yoursite.com/login)
  3. Εισαγάγετε το Όνομα Χρήστη/Email και τον Κωδικό Πρόσβασης
  4. Κάντε κλικ στο Έναρξη Ανίχνευσης - το σύστημα θα συνδεθεί πρώτα και στη συνέχεια θα ανιχνεύσει τις προστατευμένες σελίδες

Πώς Λειτουργεί

Όταν ενεργοποιείτε την προστασία με κωδικό, ο ανιχνευτής:

  1. Επισκέπτεται τη σελίδα σύνδεσής σας και εντοπίζει αυτόματα τα πεδία φόρμας
  2. Υποβάλλει τα διαπιστευτήριά σας (συμπεριλαμβανομένων τυχόν CSRF tokens)
  3. Διατηρεί την πιστοποιημένη περίοδο σύνδεσης κατά την ανίχνευση
  4. Starts from where you're redirected after login (e.g., your dashboard)
  5. Discovers and crawls all protected pages it can find

Συμβουλή: Ο ανιχνευτής εντοπίζει αυτόματα τα πεδία φόρμας (email, όνομα χρήστη, κωδικός πρόσβασης) και τα διακριτικά ασφαλείας, οπότε λειτουργεί με τις περισσότερες φόρμες σύνδεσης χωρίς πρόσθετη διαμόρφωση.

Για Προχωρημένους: Προσαρμοσμένα Ονόματα Πεδίων

Αν η φόρμα σύνδεσής σας χρησιμοποιεί μη τυπικά ονόματα πεδίων, αναπτύξτε την ενότητα "Για Προχωρημένους" και καθορίστε:

  • Όνομα πεδίου ονόματος χρήστη - Το όνομα πεδίου φόρμας για όνομα χρήστη/email (π.χ., user_email)
  • Όνομα πεδίου κωδικού πρόσβασης - Το όνομα πεδίου φόρμας για κωδικό πρόσβασης (π.χ., user_pass)

Περιορισμοί: Η ανίχνευση με προστασία κωδικού λειτουργεί με τυπικές φόρμες σύνδεσης HTML. Ενδέχεται να μην λειτουργεί με:

  • Συνδέσεις βασισμένες σε JavaScript (React, Vue, Angular single-page apps)
  • Συνδέσεις προστατευμένες με CAPTCHA ή reCAPTCHA
  • Έλεγχος ταυτότητας δύο παραγόντων (2FA)
  • Συνδέσεις OAuth (Google, Facebook, κ.λπ.)
  • Ροές σύνδεσης πολλαπλών βημάτων

Συμβουλή: Αντί να χρησιμοποιείτε τον προσωπικό σας λογαριασμό, εξετάστε το ενδεχόμενο δημιουργίας αποκλειστικού λογαριασμού ειδικά για ανίχνευση. Αυτό σας επιτρέπει να ελέγχετε ακριβώς τι μπορεί να προσπελάσει ο ανιχνευτής.

Βέλτιστες Πρακτικές

Πριν την Ανίχνευση

  • Make sure your website is accessible and pages load correctly
  • Check that important pages are linked from your homepage or sitemap
  • For password-protected crawls, verify your credentials work

Επιλογή Σελίδων

  • Start with your most important pages - product pages, FAQs, services
  • Use Manual mode if you only need specific pages
  • Αποφύγετε την ανίχνευση σελίδων με παρωχημένες ή ανακριβείς πληροφορίες

Μετά την Ανίχνευση

  • Ελέγξτε το ανιχνευμένο περιεχόμενο στη βάση γνώσεων σας
  • Αφαιρέστε τυχόν άσχετες σελίδες που καταγράφηκαν
  • Δοκιμάστε την ΤΝ σας με ερωτήσεις για το ανιχνευμένο περιεχόμενο
  • Επανιχνεύστε περιοδικά για να διατηρείτε το περιεχόμενο ενημερωμένο

Σημείωση: Κάθε νέα ανίχνευση αντικαθιστά την προηγούμενη για αυτόν τον ιστότοπο. Η ΤΝ σας θα χρησιμοποιεί πάντα το πιο πρόσφατα ανιχνευμένο περιεχόμενο.

Διαχείριση Ανιχνευμένων Σελίδων

Αφού ολοκληρωθεί μια ανίχνευση, μπορείτε να κάνετε προεπισκόπηση και διαχείριση μεμονωμένων σελίδων από την ενότητα Βάση Γνώσεων στον Πίνακα Ελέγχου σας.

Προεπισκόπηση Περιεχομένου Σελίδας

  1. Μεταβείτε στον Πίνακα Ελέγχου σας και ανοίξτε την ενότητα Βάση Γνώσεων
  2. Κάντε κλικ σε ένα στοιχείο ανίχνευσης για να το ανοίξετε — θα δείτε μια λίστα με όλες τις ανιχνευμένες σελίδες
  3. Click any page title to preview its extracted content
  4. Χρησιμοποιήστε το κουμπί Επιστροφή στις σελίδες για επιστροφή στη λίστα σελίδων

Συμβουλή: Η προεπισκόπηση σελίδων είναι ένας εξαιρετικός τρόπος για να επαληθεύσετε ότι ο ανιχνευτής εξήγαγε το σωστό περιεχόμενο. Αν μια σελίδα φαίνεται λανθασμένη, μπορείτε να την επεξεργαστείτε απευθείας ή να τη διαγράψετε και να προσθέσετε το περιεχόμενο χειροκίνητα.

Επεξεργασία Μεμονωμένων Σελίδων

Μπορείτε να επεξεργαστείτε το εξαχθέν περιεχόμενο οποιασδήποτε ανιχνευμένης σελίδας. Αυτό είναι χρήσιμο για διόρθωση προβλημάτων μορφοποίησης, αφαίρεση άσχετων ενοτήτων ή προσθήκη απούσας πληροφορίας.

  1. Open the crawl item and click a page title to view its content
  2. Click the Edit button at the top of the preview
  3. Τροποποιήστε τον τίτλο ή το περιεχόμενο όπως χρειάζεται
  4. Κάντε κλικ στο Αποθήκευση & Επανένθεση — τα AI embeddings της σελίδας θα αναδημιουργηθούν με το ενημερωμένο περιεχόμενο

Σημείωση: Η επεξεργασία μιας σελίδας επανενθέτει μόνο εκείνη τη συγκεκριμένη σελίδα, όχι ολόκληρη την ανίχνευση. Οι άλλες ανιχνευμένες σελίδες σας δεν επηρεάζονται.

Εκ νέου ανίχνευση μεμονωμένων σελίδων

Εάν μια σελίδα στον ιστότοπό σας έχει ενημερωθεί, μπορείτε να κάνετε εκ νέου ανίχνευση μόνο αυτής της σελίδας χωρίς να ανιχνεύσετε ολόκληρο τον ιστότοπό σας.

  1. Ανοίξτε το στοιχείο ανίχνευσης από τη Βάση Γνώσεων σας
  2. Click the re-crawl button next to the page you want to update
  3. Επιβεβαίωση — η σελίδα θα ανακτηθεί εκ νέου και τα embeddings της θα ενημερωθούν με το πιο πρόσφατο περιεχόμενο

Συμβουλή: Αυτό είναι εξαιρετικό για τη διατήρηση μεμονωμένων σελίδων ενημερωμένων μετά από αλλαγές περιεχομένου, χωρίς να χρειάζεται να ανιχνεύσετε εκ νέου εκατοντάδες σελίδες.

Διαγραφή Μεμονωμένων Σελίδων

Μπορείτε να αφαιρέσετε συγκεκριμένες σελίδες από μια ανίχνευση χωρίς να διαγράψετε ολόκληρη την ανίχνευση. Αυτό είναι χρήσιμο για αφαίρεση άσχετων, διπλών ή εσφαλμένα ανιχνευμένων σελίδων.

  1. Ανοίξτε το στοιχείο ανίχνευσης από τη Βάση Γνώσεων σας
  2. Κάντε κλικ στο κουμπί διαγραφή δίπλα στη σελίδα που θέλετε να αφαιρέσετε
  3. Επιβεβαιώστε τη διαγραφή — η σελίδα και τα embeddings της θα αφαιρεθούν μόνιμα

Σημείωση: Αν διαγράψετε όλες τις σελίδες από μια ανίχνευση, ολόκληρη η καταχώρηση ανίχνευσης θα αφαιρεθεί αυτόματα από τη βάση γνώσεων σας.

Αντιμετώπιση Προβλημάτων

Η ανίχνευση επιστρέφει λιγότερες σελίδες από τις αναμενόμενες

  • Οι σελίδες ενδέχεται να μη συνδέονται από ανιχνεύσιμες σελίδες
  • Ορισμένες σελίδες ενδέχεται να αποκλείονται από το robots.txt
  • Cloudflare or other security services might block the crawler
  • Solution: Use Manual mode to specify exact URLs

Η ανίχνευση με προστασία κωδικού αποτυγχάνει

  • Επαληθεύστε ότι τα διαπιστευτήριά σας είναι σωστά
  • Ελέγξτε αν η σύνδεσή σας χρησιμοποιεί CAPTCHA ή 2FA
  • Try specifying custom field names in Advanced settings
  • Your site might use JavaScript-based authentication (not supported)

Εναλλακτικές αν η ανίχνευση δεν λειτουργεί:

  • Κάντε προσωρινά τις σελίδες δημόσιες, ανιχνεύστε τις και στη συνέχεια επανενεργοποιήστε την προστασία
  • Αποθηκεύστε τις σελίδες ως αρχεία HTML και ανεβάστε τα μέσω Μαζικής Αποστολής

Το περιεχόμενο φαίνεται ελλιπές

  • Ορισμένο περιεχόμενο ενδέχεται να φορτώνεται μέσω JavaScript (δεν εξάγεται)
  • Το περιεχόμενο ενδέχεται να βρίσκεται σε εικόνες (δεν εξάγεται ως κείμενο)
  • Λύση: Προσθέστε χειροκίνητα το απόν περιεχόμενο μέσω αποστολής Κειμένου ή PDF