Nazaj na nadzorno ploščo

Dokumentacija

Naučite se uporabljati Asyntai

Indeksiranje spletnega mesta

Samodejno izvlecite vsebino s strani vašega spletnega mesta

Začnite indeksiranje

Pregled

Indeksirnik spletnega mesta samodejno odkriva in izvleče vsebino z več strani na vašem spletnem mestu. Namesto dodajanja strani eno po eno lahko indeksirate celotno spletno mesto (ali določene razdelke) in samodejno dodate vso vsebino v bazo znanja vaše UI.

Indeksirnik sledi povezavam za odkrivanje strani, izvleče besedilno vsebino in obdela vse, da lahko vaša UI odgovarja na vprašanja o vašem spletnem mestu.

Načini indeksiranja

Izbirate lahko med dvema načinoma indeksiranja glede na vaše potrebe:

Samodejni način

Indeksirnik začne z vaše domače strani in samodejno odkriva strani s sledenjem povezavam. Preveri tudi vaš sitemap.xml, če je na voljo. Najbolje za indeksiranje celotnega spletnega mesta ali velikih delov.

Vsi načrti

Ročni način

Navedete natančne URL-je za indeksiranje (ločene z vejicami). Indeksirnik obišče samo te določene strani. Najbolje, ko želite v bazo znanja dodati samo določene strani.

Omejitve indeksiranja po načrtu

The maximum number of pages you can crawl depends on your plan:

Načrt Največ strani Ročni način Zaščiteno z geslom
Brezplačno 50 strani
Starter 250 strani
Standard 1.000 strani
Pro 5.000 strani

Strani zaščitene z geslom

Potrebujete indeksiranje strani za prijavo? Omogočite možnost "Strani zaščitene z geslom" za indeksiranje vsebine samo za člane, nadzornih plošč ali katerih koli z geslom zaščitenih območij vašega spletnega mesta.

Kako uporabiti

  1. Omogočite stikalo "Strani zaščitene z geslom" na strani za indeksiranje
  2. Vnesite URL prijavne strani (npr. yoursite.com/login)
  3. Vnesite svoje uporabniško ime/e-pošto in geslo
  4. Kliknite Začni indeksiranje - sistem se bo najprej prijavil, nato indeksiral zaščitene strani

Kako deluje

Ko omogočite zaščito z geslom, indeksirnik:

  1. Obišče vašo prijavno stran in samodejno zazna polja obrazca
  2. Pošlje vaše poverilnice (vključno z morebitnimi žetoni CSRF)
  3. Ohranja avtenticirano sejo med indeksiranjem
  4. Začne od tam, kamor ste preusmerjeni po prijavi (npr. vaša nadzorna plošča)
  5. Odkriva in indeksira vse zaščitene strani, ki jih najde

Nasvet: Indeksirnik samodejno zaznava polja obrazca (e-pošta, uporabniško ime, geslo) in varnostne žetone, zato deluje z večino prijavnih obrazcev brez dodatne konfiguracije.

Napredno: Prilagojena imena polj

Če vaš prijavni obrazec uporablja nestandardna imena polj, razširite razdelek "Napredno" in navedite:

  • Ime polja uporabniškega imena - Ime polja obrazca za uporabniško ime/e-pošto (npr. user_email)
  • Ime polja gesla - Ime polja obrazca za geslo (npr. user_pass)

Omejitve: Indeksiranje zaščiteno z geslom deluje s standardnimi prijavnimi obrazci HTML. Morda ne bo delovalo z:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • Prijavami, zaščitenimi s CAPTCHA ali reCAPTCHA
  • Dvofaktorsko avtentikacijo (2FA)
  • Prijavami OAuth (Google, Facebook itd.)
  • Večstopenjskimi prijavnimi postopki

Nasvet: Namesto uporabe osebnega računa razmislite o ustvarjanju namenskega računa posebej za indeksiranje. To vam omogoča natančen nadzor nad tem, do česa ima indeksirnik dostop.

Najboljše prakse

Pred indeksiranjem

  • Make sure your website is accessible and pages load correctly
  • Check that important pages are linked from your homepage or sitemap
  • Za indeksiranje zaščiteno z geslom preverite, da vaše poverilnice delujejo

Izbira strani

  • Start with your most important pages - product pages, FAQs, services
  • Uporabite ročni način, če potrebujete samo določene strani
  • Izogibajte se indeksiranju strani z zastarelimi ali netočnimi informacijami

Po indeksiranju

  • Preglejte indeksirano vsebino v svoji bazi znanja
  • Odstranite morebitne nepomembne strani, ki so bile zajete
  • Preizkusite svojo UI z vprašanji o indeksirani vsebini
  • Redno ponovno indeksirajte, da vsebina ostane posodobljena

Opomba: Vsako novo indeksiranje nadomesti prejšnje za to spletno mesto. Vaša UI bo vedno uporabljala nazadnje indeksirano vsebino.

Upravljanje indeksiranih strani

Ko je indeksiranje zaključeno, lahko predogledate in upravljate posamezne strani iz razdelka Baza znanja na vaši nadzorni plošči.

Predogled vsebine strani

  1. Pojdite na svojo nadzorno ploščo in odprite razdelek Baza znanja
  2. Kliknite na postavko indeksiranja, da jo odprete — videli boste seznam vseh indeksiranih strani
  3. Kliknite kateri koli naslov strani za predogled izvlečene vsebine
  4. Uporabite gumb Nazaj na strani za vrnitev na seznam strani

Nasvet: Predogled strani je odličen način za preverjanje, ali je indeksirnik izvlekel pravo vsebino. Če stran izgleda napačno, jo lahko neposredno uredite ali izbrišete in namesto tega ročno dodate vsebino.

Urejanje posameznih strani

Izvlečeno vsebino katere koli indeksirane strani lahko uredite. To je uporabno za odpravljanje težav z oblikovanjem, odstranjevanje nepomembnih razdelkov ali dodajanje manjkajočih informacij.

  1. Open the crawl item and click a page title to view its content
  2. Kliknite gumb Uredi na vrhu predogleda
  3. Po potrebi spremenite naslov ali vsebino
  4. Kliknite Shrani in znova vdelaj — vdelave UI strani bodo regenerirane s posodobljeno vsebino

Opomba: Urejanje strani znova vdela samo to določeno stran, ne celotnega indeksiranja. Vaše druge indeksirane strani niso prizadete.

Ponovno brskanje posameznih strani

Če je bila stran na vaši spletni strani posodobljena, lahko znova prebrskate samo to stran brez ponovnega brskanja celotne spletne strani.

  1. Odprite postavko indeksiranja iz vaše baze znanja
  2. Click the re-crawl button next to the page you want to update
  3. Potrdite — stran bo znova pridobljena in njene vložitve posodobljene z najnovejšo vsebino

Nasvet: To je odlično za ohranjanje posameznih strani posodobljenih po spremembah vsebine, brez potrebe po ponovnem brskanju stotin strani.

Brisanje posameznih strani

Določene strani lahko odstranite iz indeksiranja, ne da bi izbrisali celotno indeksiranje. To je uporabno za odstranjevanje nepomembnih, podvojenih ali napačno indeksiranih strani.

  1. Odprite postavko indeksiranja iz vaše baze znanja
  2. Kliknite gumb izbriši poleg strani, ki jo želite odstraniti
  3. Potrdite brisanje — stran in njene vdelave bodo trajno odstranjene

Opomba: Če izbrišete vse strani iz indeksiranja, bo celoten vnos indeksiranja samodejno odstranjen iz vaše baze znanja.

Odpravljanje težav

Indeksiranje vrne manj strani kot pričakovano

  • Strani morda niso povezane z odkrivnih strani
  • Nekatere strani so morda blokirane z robots.txt
  • Cloudflare ali druge varnostne storitve lahko blokirajo indeksirnik
  • Solution: Use Manual mode to specify exact URLs

Indeksiranje zaščiteno z geslom ne uspe

  • Preverite, da so vaše poverilnice pravilne
  • Preverite, ali vaša prijava uporablja CAPTCHA ali 2FA
  • Poskusite navesti prilagojena imena polj v naprednih nastavitvah
  • Your site might use JavaScript-based authentication (not supported)

Alternative, če indeksiranje ne deluje:

  • Začasno naredite strani javne, jih indeksirajte, nato znova omogočite zaščito
  • Shranite strani kot datoteke HTML in jih naložite prek množičnega nalaganja

Vsebina se zdi nepopolna

  • Nekatera vsebina se morda nalaga prek JavaScripta (ni izvlečena)
  • Vsebina je morda v slikah (ni izvlečena kot besedilo)
  • Rešitev: Ročno dodajte manjkajočo vsebino prek nalaganja besedila ali PDF